#aiart
Машинные рисунки.
Сурц -> twitter.com/KLaknatullah

...
Мне кажется, промпты для SD понемногу превращаются в какой-то свой отдельный декларативный ЯП, только непонятный и плохо стандартизированный. В разных моделях может присутствовать информация об одной и той же штуковине, но наименование у нее будет разное... тем более нет "документации" о том как те или иные слова в промпте влияют на резульат, даже для какойто одной модели.

@lonelyowl промты в твиттере? У меня совместными стараниями РКН, Илона и моего хитрозакрученного обхода блокировок твиттер работает через жопу и редко, а чинить мне лень

Промптов этот чел не постит, но их можно выкавыривать из пнгшек: 

@MrClon

(audrey kawasaki, wadim kashin, livia prima:1.75), (masterpiece, best quality, ultra-detailed:1.4), (realism:1.25), <lora:DiscoElysiumStyle_v1:0.8>, (2girls, yuri:1.5), (blonde parted bangs:1.2) (thick lips, wide hips, sagging breasts, cleavage:1.25), (looking at viewer, smirk:1.25), (indoors, window, blue sky, cloud:1.15), (contemporary, casual, fashion, camisole:1.5), (shadow, sidelighting, chiaroscuro, dim lighting:1.25)
Negative prompt: (worst quality, low quality, lowres:1.4), verybadimagenegative, easy_negative, deep_negative, badhand_v4, (sepia, monochrome:1.5), signature, crowd, (frills, bag, umbrella, long neck, big head, chibi:1.25)

Промптов этот чел не постит, но их можно выкавыривать из пнгшек: 

@lonelyowl @MrClon И что из этого она по факту зделола, кроме «нарисуй юришных девочек»?

@lonelyowl @MrClon Как минимум в том, что половина этого шаманства не влияет на результат, а другая — не осознаваема нашим мозгом.

«Нарисуй юришных девочек, вот референс по стилю, особой порнухи не надо, но если целуются, то плюс».

Какого еще промпта надо? 😄

@johan @MrClon

Ну дык вперед, переведи свой пост на буржуйское наречие, закинь в sd и посмотри че получится 🤷‍♀️

@lonelyowl @MrClon ...А дальше Крита или Фотошоп, чтобы не ебаться 4 дня с промпами?

@johan @MrClon

Хочешь - ебись, не хочешь - не ебись, иди рисуй в крите 🤷‍♀️

Я не вполне понимаю в чем вообще была твоя претензия, если честно.

@lonelyowl @MrClon Претензий нет же. Просто нам выдают идею о том, что «нейросеть нарисует за 40 секунд», умалчивая, что промптом ты промуздыкаешься МНОГО часов, киловатт и нервов, в итоге получив «ну вроде красиво». В то время, как художница (но мы понимаем, что она тоже нейросеть) зделоет это быстрее, показывая эскизы и внося коррективы по ходу?..

Follow

@snark @MrClon @lonelyowl Ну... Я сказал в контексте анимешных девочек. Править баги, нарисовать в другом ракурсе, вообще, банально взять нужный образ и поставить в нужной позе? И чтобы пальцев было пять и не все из них левые...

Пока в нейронках этого нет и все «красивые картинки» на уровне среднего фотобашера (Термин, означающий текстурирование объекта с помощью фото. В фотобаше художник объединяет и смешивает трёхмерные модели и фотографии, комбинируя их в единое окончательное произведение. Некоторые приравнивают фотобашинг к фотоколлажу, но в профессиональной среде между этими двумя понятиями существует огромная разница.)

@johan @MrClon @lonelyowl В sd уже есть. Позы, выражение лиц и даже жесты

@johan @snark @MrClon

Не, тут прям разительное отличие. Никакой фотобашер не может так комбинировать картинки. Нарисовать руками с нуля такое нуууу в целом можно при хорошей фантазии и прямых руках, но нафотобашить это врядли.

twitter.com/pereulkov/status/1

@lonelyowl @snark @MrClon Угу, только фотографы/ретушеры занимаются этим каждый день.

Вот еще хороший, имхо, пример (на самом деле просто картинка нравится). okon.artstation.com/projects/q Я, конечно, не знаю, сколько времени это заняло, но я сильнее не знаю, как реализовать это нейромагией.

@johan @snark @MrClon
Это коллаж, машина делает другое и по-другому.

Сравнивать генерации с фотобашем это как говорить что анимация в фрозен и в красавице и чудовище одинаковая потому что и там и там какието пляшущие и поющие нарисованные чуваки.

@lonelyowl @snark @MrClon Это не коллаж, это эскиз из фото и 3Д, а дальше рисуем ручками.

Нейронка умеет в красивые картиночки, но пока она не понимает, что значит «чужой с вайфай-модулем в башке» — она его не отрисует же, ну?

@johan @snark @MrClon

> Нейронка умеет в красивые картиночки, но пока она не понимает, что значит «чужой с вайфай-модулем в башке» — она его не отрисует же, ну?

Способности к обобщению у SD безусловно, ограниченные, но тем не менее это ее основаная фишка и то почему эти дип-лернинг-штуки вообще кому-то интересны.

Они НЕ ВОСПРОИЗВОДЯТ картинки которые уже видели, они делают НОВЫЕ, ЕЩЕ НЕ СУЩЕСТВУЮЩИЕ картинки, используя информацию о том что они уже видели.

Если машина знает че такое "вайфай модуль", "башка" и "чужой" по отдельности, она вполне сможет воспроизвести то че ты ее просишь. Другое дело что это не однокнопочный процесс "сделай заебись" 🤷‍♀️

@lonelyowl @snark @MrClon Ну погоди. АФАЙК, они генерят шум, отбирая варианты по принципу «понравится ли кожаному мешку» на основе сходства с чем-то из обучающего датасета?

Недаром, если попросить что-ото из репертуара фотостоков, то она так с ватермарком Дримстайма и выдаст.

@johan @snark @MrClon

Как это противоречит тезису о том что SD способна обобщать и комбинировать опыт, предсказывая как может выглядить штука которой отродясь не было в датасете 🤔
Я не говорю что это какойто там сверхинтеллект который и картинку тебе нарисует и жопу подотрет, но все же, если бы SD этого не умел, он был бы аааааабсолютно бесполезен по сравнению с пресловутым фотостоком и гугол картинками.

Если уж совсем на пальцах - допустим, у тебя есть модель, которой скормили два типа картинок - белые кошки и черные квадраты малевича. Теперь ты просишь модель нарисовать черную кошку, и она тебе ее успешно рисует.
Если среди семплов были картинки с членами, он тебе и кошку с членом на лбу нарисует.

@lonelyowl @snark @MrClon Насколько я понимаю, «обобщалка» идет на этапе обучения. И обобщить заранее «Нарисуй Эллен Рипли в люке десантного корабля, сержанта, который при помощи wi-fi модулей управляет двумя чужими, на заднем плане традиционно взрывается вертолет» — это пока фантастика. А бессмысленные симпатюльки получаются хорошо, потому что мы такое любим — и как раз за новизну и оригинальность.

Но по сути, куда применить «кресло в форме авокадо» — не до конца ясно.

@johan @snark @MrClon

Еще раз! Если модель будет знать че такое "взрывающийся вертолет", "вайфай модули", "чужие" и "эллен рипли", соответственно, она тебе это нарисует. Это практически возможно, хотя качество будет варьироваться, и процесс генерации и объяснения машине того че ты отнее хочешь далеко не однокнопочный.

@lonelyowl @snark @MrClon Согласен. Я как-то так это и имею в виду.

Штош, пишите, погромисты, пишите!

@johan @snark @MrClon
Вы думаете дип лернинг это шутки чтоли?

@ovivu @lonelyowl @MrClon @snark А если представить, что на картинке выходное отверстие, и где-то должно быть входное — то становится не так смешно...

@johan@qoto.org @snark@rud.life @MrClon@lor.sh @lonelyowl@lor.sh

Править баги, нарисовать в другом ракурсе, вообще, банально взять нужный образ и поставить в нужной позе? И чтобы пальцев было пять и не все из них левые…

Вот это как раз все есть) разве что "банально взять нужный образ и поставить в нужной позе" - не тривиаальная задача, но не невозможная

@pastecat @MrClon @snark @johan

С контролнетом это стало сильно проще. Определенный уровень пердолинга все еще требуется, но больше не нужно рандомить

@lonelyowl@lor.sh @MrClon@lor.sh @snark@rud.life @johan@qoto.org ну, тут больше проблем с образом будет, чем с позой. Лору тоже еще обучить надо)

@pastecat @MrClon @lonelyowl @snark А как быть с невидимыми частями плоского рисунка? Додумывать. А в следующем кадре додумается иначе.

@pastecat @MrClon @lonelyowl @snark Я имею в виду — на уровне поправить что-то на рисунке.

@johan@qoto.org @MrClon@lor.sh @lonelyowl@lor.sh @snark@rud.life а, сорри. Ну, во-первых можно генерить только часть пикчи, чтобы поправить огрехи, это сильно упрощает жизнь, но лениво)))
Во-вторых зафайнтюнить чтобы генерить персонажа стабильно можно. Хоть и более трудоемко, и нужен датасет.
То есть задача-то в принципе решаемая уже сейчас. Решит-ли эту задачу человек лучше? Ну, пожалуй. Но это вопрос времени, имхо. Если что то сохранит традиционное излбразительное искусство - то точно не способность человека соревноваться с машиной в способности вносить правки и учитывать пожелания заказчика)

@pastecat @MrClon @snark @johan

> Но это вопрос времени, имхо.

А еще вопрос выигрыша в генетическую лотерею. То что дочь маминой подруги научилась рисовать персонажей в 10 разных стилях и любых ракурсах за 3 года совершенно не значит что у тебя это получится за 10 лет 🤷‍♀️

Так што если переходить в плоскость доступности арта для всех включая криворуких, ии со всеми его недостатками тут явно в выигрыше.

@lonelyowl @pastecat @MrClon @snark В общем, посмотрим, когда его в реальных проектах/работах начнут использовать не единично, а как фотоаппарат.

@johan @MrClon @pastecat @lonelyowl сейчас это хайповая тема, все хотят приобщиться. Поэтому мы очень скоро увидим большое количество нейросетевого контента во всех сферах. Не очень качественного, правда.

@snark @MrClon @pastecat @lonelyowl Не очень качественного контента во всех сферах мы видим... Да, блядь, сколько я себя помню — мы его видим... 😠

@johan@qoto.org @snark@rud.life @MrClon@lor.sh @lonelyowl@lor.sh нормальное распределение - это норма :) Годного контента всегда будет сильно меньше, чем средненького.

@pastecat @MrClon @lonelyowl @snark Ага, только теперь машинного будет в стопицот раз больше, нежели натурального, и хороший человеческий останется только флуктуацией на графике 😠 (Хуй с ним, всегда так было)

@johan@qoto.org @MrClon@lor.sh @lonelyowl@lor.sh @snark@rud.life Заставим машины оценивать и фильтровать контент, хули нам, как говорится :)
А потом будем использовать эту оценку чтобы заставить другие машины пилить контент, которырй те, первые машины, высоко оценят. И из этого цикла конкурентного обучения можно и не выходить.
Вот тогда отличия сведутся к минимуму. Вот тогда заживем :)

@johan @pastecat @MrClon @snark

Я все понять не могу в чем ценность "натурального"?
Картинка/мультик/игра/книжка либо хорошая, либо не хорошая. Связывать намертво в своей голове функцию качества контента с тем как, кем и почему он был сделан это верный путь к неадкватному восприятию произведения.

Далеко за примером ходить не нужно, транс-сообщество потеряло всякую способность воспринимать контент по гарри поттеру, даже тому к которому jkr вообще никакого отношения не имеет.
То же самое с атомик хартом в котором нашли кучу абсолютно притянутых за уши примером прославления совка, путина, войны и еще бох знает чего.

@lonelyowl @pastecat @MrClon @snark mastodon.ml/@lina/110276993519 Милота. Безжизненная милота на самой глубине зловещей долины.

P.S. Гаррипоттера не понимаю, в моем мире это сказки для семилеток; Атомикхарт — это шедевр, хотя не играл, и даже не буду, даже если будет на чём.

@johan @pastecat @MrClon @snark

> Безжизненная милота на самой глубине зловещей долины.

Принципиально ничем не отличается от кучи других подобных картинок, нарисованных людьми задолго до появления этих систем.

> Гаррипоттера не понимаю, в моем мире это сказки для семилеток

Ну дык это вот логика людей для которых личность автора важнее самого произведения 🤷‍♀️

От такого рода мышления не так-то просто избавиться, ибо это зашитое в человечью голову когнитивное искажение, но надо как минимум отдавать себе отчет о том что это нездоровое восприятие.

@lonelyowl @pastecat @MrClon @snark

Хмм... А ведь верно на 140% 🙂 И Клайва Льюиса, и лукьяненку, и «Гермиона за лето сильно изменилась» МЫ ж воспринимаем уж после того, как нейросеть это отнесла в нужную область памяти...

Сохранил в цитатник 🙂

Sign in to participate in the conversation
Qoto Mastodon

QOTO: Question Others to Teach Ourselves
An inclusive, Academic Freedom, instance
All cultures welcome.
Hate speech and harassment strictly forbidden.