Приветствую всех в моем блоге! Сегодня о треше, что творит нейросеть. Правда иногда, но всегда как то неожиданно.
Ничего особенного возможно в этом и нет, а вот рассказать хотя бы для смеха очень захотелось.
Итак, работая с нейросетью я обнаружил у нее ряд существенных глюков, которых можно даже систематизировать.
1. Первый и самый распространенный это искажение пропорций лица и анатомии тела человека. Кривые глаза, не симметричные стороны лица и тп. Честно говоря он уже уходит в прошлое, так как нейросеть учится и исправляет свои ошибки буквально на глазах.
2. Второй и тоже очень распространенный - это проблемы с кистями рук, пальцами и в целом с руками. Он более трудно дается сети и пока эта проблема остается.
3. Создание неких неверных изображений в связи с полным непониманием запроса.
4. Добавление ненужных деталей в изображение. Это можно решить, если у сети есть отрицательные промты. То есть вы пишите в них чего бы вы не хотели видеть в своей композиции и нейросеть учитывает это в своей работе.
Рассмотрим все по порядку. Начнем с первой проблемы и увидим что это такое.
Для тестирования одной сети я задал пром типа "портрет девушки на тропическом пляже, синий купальник бикини, длинные вьющиеся волосы, милая улыбка, ленты в волосах, фон - небо, облака и море".
Также я сделал ряд настроек в ее интерфейсе и увеличил размеры изображения. Вот что мне выдал алгоритм.
Вы можете понять, что тут происходит? Я уже не в силах. Это реально лютый треш! Даже страшновато как-то ...
Зато масса ленточек и волосы кудрявые. Спасиба!
Я изменил настройки и выбрал иную модель для генерации. И снова ..
Опять какой то лютый мутант получился, зато ленточек полно! Фу жуть.
И новый заход на генерацию со сменой настроек и новой моделью.
Так и откуда у нее три головы? Нет, я не знаю. Но зато она их пытается поддержать! Чтобы не упали видимо.
Новая генерация и новая цифровая модель модель.
Вау, вроде лучше... Но опять что то с рукой или она сломана. Такая милая девочка получилась, но руку кто то выломал аж назад.
Я не мог понять почему же все так получается и заметил, что сайт нейросети выдает мне какое то предупреждение, после увеличения размеров изображения. Оказывается каждая модель натренирована при определенном изображении и если менять его, то результат будет сильно глючить, что я и получил. Стоило мне при выборе модели оставить разрешение в пределах тренированной модели, как сеть выдала нормальный и вполне сносный результат.
Девочка сразу получилась правильно простроенной и почти все требования были выполнены. Но тут куда то делись ленточки в волосах, в то время как на трешевых изображениях лент хватало с избытком.
Ну да ладно и так сойдет!
В другой сети я создал массу женских портретов и старался как то избежать кривых глаз. Что ж смотрим что получилось.
Пусть женские портреты и получались красивыми и выразительными, но они постоянно имели некую асимметрию глаз. То глаза смотрят в разные стороны, то сами радужки глаз неправильной формы. Это меня сильно озадачило, так как я хотел использовать изображения для продажи, а как видите здесь такая халтура неприменима. Увы.
Рассмотрим вторую проблему - проблемы с кистями рук.
В этой же сети я попробовал создать стилизованные изображение девушки алхимика. И в чем то сеть справилась на отлично, но вот с руками пошел снова жесткий косяк.
Не смотря на отличное окружение и сам портрет девушки, пальцы рук получились ужасными. Где то три пальца где то полпальца, а где то и вовсе шесть на руке или вместо пальцев сардельки. Да и глаза подкачали. Мда, это все химикаты так действуют на алхимиков. Грустно, господа.
Пока с портретами я закончил....
Третья проблема.
Нейросеть часто не понимает задание, которое мы ей задаем.
На этой картинке я хотел получить дождевого червячка, который вылазит из земли и улыбается, в стиле 3D Пиксар. И вот что вышло. Похоже?
Неожиданно даже! Что это такое на самом деле? Честно я так и не понял. Видимо сеть просто не знает что такое дождевой червяк и ее на это не тренировали. Поэтому получается нечто очень отдаленно напоминающее червяка, зато стиль Пиксар соблюден.
Я долго хотел получить красивую композицию замершей во льду розы, но все время сеть ходила вокруг да около.
смотрим!
Даже все это тоже очень красиво получается, но по сути задача так и не была выполнена, как бы я не бился над этим.
Позже в иной сети мне удалось получить замершие во льду цветы, но совсем случайно и промт звучал: цветы и лед.
на запросы "замерзший во льду цветок" еще были такие изображения. Далеко, но красиво...
На промт "композиция, розовые розы, бокалы, воздушные шары, блестки, конфетти и лужи из воды" сеть выдала следующее. Ниже я поясню почему так.
Смотрим и не удивляемся.
Конечно ,все это очень даже прикольно и забавно, но скорее какая то мешанина из всего подряд получилась. Дело здесь в том, что я выбирал разные модели на сайте и увеличивал разрешение. Разные модели были заточены под определенные функции. Одна для создания стилизованных персонажей, другая для реалистичности, третья под киношную картинку и тд. Поэтому только подобрал правильную модель и настройки я смог получить нужный результат.
Промты я немного менял от модели к модели. Последняя картинка - это именно модель для создания киношной картинки. Видимо получилось, так я и хотел.
И последняя проблемы - создание лишних деталей в композиции.
ранее вы уже видели эти изображения с массой воздушных шариков и множества деталей.
Именно про такое я говорю. В промте не было такого ужаса и переизбытка каких то рваных цветов или лопнувших шариков.
так при работе над темой "Memento mori" (Помни о смерти) я столкнулся с проблемой и непонимания сети самого запроса и лишних непонятных деталей. Отрицательные промты почему то не помогали.
нет, нет - я не заказывал чашу с золотом и чем там у вас. Я хотел золотой череп с резным орнаментом и инкрустацией, золотые монеты, свечи, и драгоценности, на каменном столу. А тут опять чего? И что у него с нижней челюстью?
Попробуем еще!
Куда то делась инкрустация и резьба, хотя череп получился правильный. Появился какой то резной графин и некий медальон. Что к чему?
Ну как еще разок...
Откуда на черепе какая то маковка из церкви?. Да и сам череп толи ребенка, толи обезьяны какой то...
Попробую в иной нейросети, где можно выбирать модели и менять настройки ("Leonardo"). Но запрос был уже изменен, правде не существенно. В некоторых заданиях я убирал свечи. Все это в разных моделях сделано. Посмотрим.
Лучше и очень брутально так получилось. Правда вот этих ягод справа я не заказывал.
А тут вышло какое то пиршество смерти. И много деталей совсем не нужных здесь.
Ближе к Терминатору из заезженной франшизы. Но череп слишком вытянут, а вместо инкрустации тупо облеплен какими брызгами из джема. Неа, точно не то!
Тут не просто лишние детали появились, скорее их просто не стало. Зато черепушек стало сразу две и снова брызги из джема.
Такие вот проблемы встречаются в нейросети. Часть их создает сам пользователь, часть эти системные недоработки. Но тем не менее с этим можно и нужно работать, развивать это направление и самим развиваться в этом.
А на этом у меня все!
Всем хорошего настроения и удачных дел!
PS. И конечно, вы можете заказать все эти картины у нас в магазине. Нужно просто выбрать.