Проектов, в которых требовалось использовать нейросети, у меня было пока всего два, а вот таких, где можно было бы подключить нейронку в помощь, — гораздо больше. Расскажу о некоторых из них и полученных результатах — как удачных, так и не очень.
Задачей одного из первых проектов, который подразумевал использование графических нейросетей, была, собственно, демонстрация возможностей искусственного интеллекта. Техническое задание было довольно простым: проиллюстрировать большую презентацию изображениями, созданными ИИ.
Задача в целом была выполнена в прямом смысле легко и быстро. На каждом из слайдов раскрывалась какая-то тема искусственного интеллекта, к примеру: использование роботизации и автоматизации в бизнес-процессах, цифровизация документооборота и тому подобные. Если с частью визуализаций бухгалтерских отчётностей особых трудностей не возникло, то в более замысловатых запросах, типа «извлечение сущностей», ИИ на тот момент спасовал.
Midjourney в своём руководстве описывает, что промпт (prompt — «подсказка», текстовый запрос на генерацию изображения) даже в виде одного смайла «даст пищу для размышлений искусственному интеллекту» и он выдаст некий результат. Запрос «представить извлечение сущностей» (что может быть распознаванием текста на чернильном штампе, распознаванием вида документа: паспорт, СНИЛС и т. п.) Midjourney, видимо, вовсе «не понял». Поэтому для таких слайдов пришлось придумывать сюжет, который затем описывался в промпте.
Поначалу использование графической нейросети вводит в некую эйфорию: кажется, что сгенерировать можно абсолютно всё. Но разбираясь в деталях и используя нейросеть для рабочих нужд, становится ясно, что этот инструмент далёк от совершенства и иногда не может справиться с поставленными задачами. Или, точнее, выполняет их довольно шаблонно и посредственно.
С чем у ИИ нет проблем — так это с совмещением несовместимых вещей, как то: кот-космонавт, или бумажный истребитель, или самообучающийся робот (хотя и выглядит это забавно и подходит только для развлечений).
Такой вариант применения графических нейросетей (иллюстрация текстовой информации) взяли на вооружение новостные каналы. Теперь новости в телеграм-каналах не просто текстовые, а сопровождаются картинками, сгенерированными ИИ, а лента и паблики ВКонтакте пестрят искусственными фотографиями, за которыми, к слову, иногда сложно разглядеть нейросеть, так как выглядят они как работа профессионального фотографа. Сколько продлится такой тренд, предугадать сложно, но пока что это один из наиболее простых и понятных способов использования графического ИИ.
Вторым проектом с обязательным использованием графической нейросети стала разработка обложки для очередного номера периодического издания о лёгкой промышленности — журнала «Легпром ревю».
Один из самых простых вариантов решить поставленную задачу — описать тематику и получить готовую картинку. По такому пути уже идут некоторые издания, размещая на обложке полностью сгенерированное ИИ изображение (тем более что нынешняя версия того же Midjourney позволяет делать изображения высокого качества, которых вполне хватает для формата А4). Использовать такой подход не хотелось.
Тематика номера была посвящена искусственному интеллекту, и что-то, сгенерированное нейросетью на обложке, должно было присутствовать обязательно. Неплохо получились меховые буквы, но к теме лёгкой промышленности они подходили мало и имели разве что мимолётную эстетическую ценность. Поэтому для начала была создана шрифтовая композиция (с использованием только собственных навыков, образования и вкуса), в которую уже были внедрены изображения, созданные нейросетью. Ну и пока что подготовить в печать, соблюсти требования типографии нейросети не в состоянии.
Также одним из успешных проектов с применением нейросети (но не графической, а текстовой) стал дизайн одноразовых бумажных стаканчиков.
Один из клиентов, который занимается производством и продажей одноразовых бумажных стаканчиков, провёл аудит ассортимента своих товаров и обнаружил, что большинство стаканчиков имеют нейтральный или «женственный» дизайн: розовая или фиолетовая цветовая гамма, котики, сердечки и т. п. И принял решение разнообразить свой ассортимент «брутальным мужским» дизайном стаканчика.
Задача была поставлена весьма размыто, кроме ассоциаций «брутальный, мужской» был предоставлен только скриншот со смартфона сине-чёрной абстрактной картинки.
Для создания «мужского» дизайна был использован типографический дизайн, минимум графики, основой дизайна служил текст. Тексты для дизайна были сгенерированы чат-ботом GPT от «Яндекса» Алисой. Запросы были на написание нескольких «брутальных мужских фраз про успех», «мотивирующих фраз для брутального мужчины». С чем Алиса справилась успешно, и с минимальными корректировками фразы были использованы в первом варианте дизайна. Для второго варианта, помимо мотивирующих фраз, я решил использовать цифры как символ чего-либо. Первую ассоциацию самостоятельно придумал быстро: выстроить временную абстрактную шкалу с указанием времени — 5:30, 8:00, 12:30, что уже само по себе настраивает на какую-то мотивацию: ранний подъём, правильный распорядок дня и т. п. Но хотелось использовать ещё какую-то цифру или число.
Придумать «какие-нибудь мотивирующие цифры и обосновать их» Алиса не смогла и расписалась в своём бессилии. От следующего запроса — придумать «цифру в контексте мотивации и достижения цели», я ожидал нечто вроде «ответа на главный вопрос жизни, вселенной и всего такого», который, как известно, число 42. Но Алиса справилась замечательно и выдала «100%», что тут же было использовано в дизайне. Клиент был очень доволен результатом, выбрать один из двух вариантов не смог и стал производить оба варианта стаканчиков с брутальным дизайном.
Это были примеры удачного использования искусственного интеллекта в работе. Хоть и с небольшими трудностями, но сгенерированные тексты и картинки ушли в работу: выступление с презентацией прошло с успехом, журнал отпечатан и распространяется, тираж стаканчиков в феврале уже будет представлен в продаже в Хабаровске.
Но были и некоторые моменты, в которых нейросети помочь не смогли. Это касается таких сложных проектов, как инфографика, разработка логотипов или графическая работа с текстом/шрифтом, чего искусственный интеллект пока что делать не умеет или делает очень слабо.
В запросе на инфографику я прописывал основную тему и некоторые цифры — было интересно, как нейросеть обработает данные и распределит «массы» в композиции. Результат был явно хуже ожидаемого и напоминал не продуманную композицию, хотя бы несколько напоминающую цифры из запроса, а больше походил на компиляцию наборов для создания инфографики с фотостоков. Как и в случае с журналом, композицию (да и элементы инфографики) пришлось рисовать и верстать самостоятельно.
ИИ пока что посредственно справляется с текстурами и узорами. Бесшовные паттерны можно использовать разве что для вдохновения. Качественные текстуры для трёхмерных моделей в настоящее время проще найти в специализированных библиотеках.
Также посредственно обстоят дела с генерированием идей и концепций в текстовом варианте. Это объяснимо: создать что-либо новое на основе старых знаний хорошо умеет пока что только человек.
В качестве примера приведу мозговой штурм при разработке логотипа — для начала продумываются идеи и смысл, который будет заложен в логотип. Ставя такую задачу нейросети по генерации идей для логотипа компании, производящей чистящие средства и текстиль для уборки, получил результат студента-первокурсника факультета графического дизайна, с трудом продирающегося сквозь дебри и сложности первой сессии: «Для чистящих средств можно нарисовать символ, который обозначает чистоту и свежесть. Например, это может быть капля воды, которая падает на грязную поверхность и превращает её в чистую. Также можно использовать изображение руки, держащей тряпку и стирающей грязь. Третий вариант — это изображение молекулы, которая разрушает грязь и очищает поверхность».
Как инструмент генерирования идей и концепций, а точнее их визуализации для демонстрации клиенту, графические нейросети не то чтобы упрощают работу, они берут на себя огромный пласт труда: минуются черновые эскизы, работа иллюстратора по воплощению чёрно-белых набросков в цвет, работа 3D-моделлера для построения модели. Так было, к примеру, с эскизом для маскота алкогольной розничной сети. Midjourney на ура решил эту задачу, эскизов было много, сразу в виде трёхмерной модели в «пиксаровском» стиле с идеально выставленным светом. Также легко сгенерировался «молочный дракон» для календаря молокозавода на 2024 год. Но от шаблонности таких изображений и простоты их генерации начинает несколько мутить. А это верный признак того, что «нейросетевые картинки» вскоре могут заполнить собой огромную часть сетевого пространства, и мы по крупинкам будем отыскивать качественный контент среди гор цифрового мусора. Но и не использовать нейросети уже невозможно.
С интересом читаю новости, в которых пишут о том, как удаётся зарабатывать на ИИ. Про перепродажу серверных ресурсов под своим брендом и различные «курсы обучения нейросетям», наверное, и не стоит упоминать. А вот забавные проекты есть. Кто-то генерирует тысячи различных картинок и загружает их на фотосток (на некоторых стоках уже появился раздел «сгенерировано ИИ»), кто-то генерирует и продаёт логотипы. Оплачивается несметное количество текстовых отзывов, сгенерированных чат-ботом и слегка отредактированных человеком.
Хоть мы этого зачастую не замечаем и воспринимаем как должное — графические нейросети плотно вошли в повседневную работу дизайнера. Пока что Pinterest и Behance выигрывают по сравнению с нейросетями в качестве источника вдохновения (всё-таки проекты делают живые люди). А нейросеть для многих становится помощником в генерации идей, подборе цветовых гамм, написании текстов. И несмотря на стремительное развитие нейросетей, работа у дизайнеров до наступления технологической сингулярности точно будет.
Опубликовано в журнале «Индустрия печати» №1 2024