Личный опыт. Как в SMM использовать нейросети?

Неделя экспериментов и 10 часов работы алгоритма. Итоги + небольшой гайд

452

11.02.2023

Читать 4 минуты

НИКАК

Всю неделю я мучаю Midjourney. С одной стороны результаты — полный восторг. У меня буквально текут слюни на клавиатуру от того, что я постоянно вижу перед собой. Это нереально. Это фантастика.

С другой стороны — это абсолютно неприменимо в SMM-работе.

Сейчас всё объясню на пальцах и с примерами, благо примеров у меня очень много.

1. Задача, с которой нейросетка справляется идеально: абстрактные картинки для статей/постов, которые не несут в себе никакого глубого смысла, кроме «ну красиво, блин».

Идеально подходит для обложек в блог dnative.ru. Попробую использовать их для Инсты. Вообще, лично для меня проблема обложек полностью закрыта. Раньше использовал бесплатные стоки, сейчас я сам генерирую картинки более интересные и актуальные, чем те, что там мог находить.

Совет: Если вам нужен не квадрат, а например соотношение 16:9 у картинки, добавьте —ar 16:9 и будет вам счастье.

2. Задача, с которой нейросеть вообще не справляется: прогнозируемый результат.

То есть создать фантастику — легко.

Создать 3D логотип с буквой D — хрен там плавал. Точнее можно, но не тот стиль, который тебе нужен. Вы знаете мой логотип (он вверху), я хотел переложить такую же букву D во что-то фантастически и неописуемо красивое.

Есть возможность скрещивать свою картинку и текст задачи. Если включить версию Midjourney 3 (команда — v3), то картинке можно присваивать вес (команда :: X, где Х = цифра) относительно другого текста.

Сегодня я попробовал решить несколько задач и начал с самой простой, как мне казалось. Адаптировать мой логотип во что-то невероятно прекрасно в 3D. С вариациями «футуристический город, неон» и так далее.

Всё круто, кроме того, что буквы D нет. Даже если пишешь «БУКВА D по центру» в 10 из 10 вариантов будет что угодно, только не D.

Есть возможность загрузить картинку, по которой будет идти рендер — прости и забудь. Всё мимо. У меня сотни крутых вариантов, на которые смотришь и говоришь «вау, круто», но простую задачу они не выполняют.

Абстрактная фигня:

Буква D:

3. Главная проблема — правки. Их невозможно вносить. Есть разные режимы, но я не могу сделать простые вещи, например: оставь всё как было, замени букву или «добавь реальные логотипы соцсетей».

Точнее номинально такая возможность есть, можно даже вносить правки в полученный результат или генерировать на основе прошлой варианта — результат всегда хуже стартового.

Исходное сгенерированное нейросетью изображение с апскейлом:

Его варианты:

Так происходит всегда. Либо у меня кривые руки, но внести адекватные изменения в полученный результат сверхсложная задача.

4. Отсюда вытекает новая проблема — продуктовый контент. Я могу загрузить фотографию, но как её будет использовать нейросеть, знает только сама нейросеть.

Можно сделать хоть 1000 постов в стиле «Как нейросеть видит героев Звёздных Войн в СССР», только для работы это не поможет.

Удобно, когда можно визуализировать любой пример в 3 клика

Для медиа — отлично.

Для экспертных блогов — тоже норм.

Для брендов — пока мимо.

5. Проблема выбора.

Остановиться просто невозможно. У тебя в одном клике и 3-4 секундах рендера всегда есть ещё 4 варианта. А потом ещё 4. И ещё… и ещё… Пока я писал этот пост, пытаясь выбрать обложку для подкаста Dnative, я сделал несколько СОТЕН изображений.

Это лишь малая часть сегодняшних экспериментов

А потом приходит новая идея, и всё по новой.

Прямо сейчас я пытаюсь решить задачу реального применения Midjourney в брендовом SMM на регулярной основе. Мой вердикт — пока не очень.

Нейросеть идеально подходит для поиска идей, причём в разных нишах. Можно даже создавать интерьеры.

А вот заменить дизайнера прямо сейчас для большей части бизнеса точно не вариант. Не говоря уже о замене фотографа.

А что в других нейросетях?

Другие сетки посмотрел (десятка два), всё и близко не стоит с уровнем креатива и детализации рассмотренной.

ОЧЕНЬ не хватает сейчас возможности нормальной интеграции своих изображений, логотипов. И самое главное — простой и удобной работы с правками полученной картинки.

Пример из практики. Первая картинка похожа на то, что я хотел. Но вместо букв DN, тут, почему-то, SD. Если бы можно было просто написать «замени буквы» — дизайнерам уже сейчас можно было бы искать новую работу.

Это вывод-резюме по итогу использования 10 часов работы алгоритма. Всегда есть возможность, что я просто не разобрался с настройками до конца, хоть и прочитал с десяток мануалов по настройке, свойствам и логике написания текста. К слову, их объединяет неуверенность в работе. То есть да, что-то, как например вес параметра, действительно влияет, а вот запятые или порядок слов… Вроде бы да, но как и что именно, кто его там разберёт.

Несколько советов для тех, кто только осваивает midjourney и хочет поэкспериментировать.

1. Слишком подробные задачи не нужны. Достаточно нескольких слов, для описания концепции. Например выше «lego pacman eats internet 3D 4k minimalistic background»

2. Сам себе противоречу, правда? Но вторая половина текста (я её подчеркнул) задаёт параметры отображения.
3D — тут всё понятно.
4K я люблю добавлять для роста детализации.
minimalistic background убирает лишние детали на фоне. Я хотел сделать обложку для подкаста и перегруз мелочью будет смущать.

Ещё классно работают приставки 1980s и всё в таком стиле. Даёт антураж результату.

3. Опытным путём я всё же пришёл к пониманию, что ремастеринг работает очень не очень. Эта возможность появляется при апскейле изображения до разрешения 2K. Как будто алгоритм зажат в рамках и создаёт хрень.

Исходный вариант, в котором меня смущали «глаза» второго чудика

Можно добавлять стили вообще любые. Neon, disney, lego, pixel style. Алгоритм понимает очень много слов.

В синтаксисе есть ещё важный параметр, который вряд ли понадобится на старте :: — это разделитель (::), который позволяет разбить отдельные элементы вашего текста для большего выделения.

Моя рекомендация: учиться работать и набивать руку нужно уже сейчас. Вся работа проходит в Discord, что не очень удобно. При регистрации вам дадут 25 попыток (ни о чём) и нужно покупать платный тариф. Тарифа за 10$ хватило мне на несколько дней активных экспериментов, если хотите погружаться, то лучше брать сразу за 30$ в месяц.

К слову. Работать в общем чате просто невозможно. Там сотни чужих картинок и команд, очень неудобно искать свои.

Мне посоветовали следующий вариант: создать в discord свой канал и добавить туда бота Midjourney. Тогда это получается пространство только с вашими работами. Плюс, туда же можно добавить друзей/коллег и работать вместе даже на базовом тарифе, поэтому если что, купить доступ можно вскладчину)