«Около 500 первых попыток я потратила, чтобы только посмотреть все варианты пылающего Кремля», – рассказывает о своем увлечении генеративной нейросетью Midjourney киевлянка Мария Шарлай /Изображение сгенерировано ИИ Midjourney в соавторстве с Марией Шарлай
Категория
Инновации
Дата

Как пылает Кремль. Нейросети генерируют картины из текста и помогают собирать на ВСУ. Может ли нейроарт стать бизнесом

5 хв читання

«Около 500 первых попыток я потратила, чтобы только посмотреть все варианты пылающего Кремля», – рассказывает о своем увлечении генеративной нейросетью Midjourney киевлянка Мария Шарлай Фото Изображение сгенерировано ИИ Midjourney в соавторстве с Марией Шарлай

Нейросети, генерирующие картинки из текста – технологический хит последнего года. В Украине они стали еще одним инструментом информационной войны. Алгоритмы DALL-E 2, Imagen, Midjourney и Stable Diffusion уже конкурируют за пользователей, хотя рынок только формируется. Как они строят на этом бизнес

«Около 500 первых попыток я потратила, чтобы только посмотреть все варианты пылающего Кремля», – рассказывает о своем увлечении генеративной нейросетью Midjourney киевлянка Мария Шарлай. Созданные искусственным интеллектом (ИИ) картинки по теме украинско-российской войны она регулярно постит в соцсетях.

Midjourney – стартап американца с математическим образованием Дэвида Хольца, называющего себя серийным предпринимателем. Его предыдущая компания – 12-летний разработчик решений для виртуальной и дополненной реальности Leap Motion – в 2019-м приобрел конкурент Ultrahaptics. На пике детище Хольца и его кофаундера Майкла Баквальда оценивалось в $306 млн, но сверхприбылей компания не приносила, поэтому продали его в десять раз дешевле.

Новый проект Хольца, над которым основатель официально работает чуть больше года, открылся для всех желающих в июле 2022 года. Это так называемая text-to-image нейросеть, создающая изображение из текста. Описание того, что должно быть на картинке, нужно отправить искусственному интеллекту через бот в мессенджере Discord. Пробный период бесплатный. Месячная подписка, дающая доступ и к веб-версии сервиса, стоит $10–30.

«Это лучшие $30 в жизни, которые я потратила на искусство», – говорит Шарлай. Профессиональной художницей она себя не считает – творчеством занималась скорее ради удовольствия. Выпускница столичного архитектурного университета КНУБА девять лет проработала коммуникационщицей в маркетинговом агентстве Aimbulance. Накануне российского вторжения вместе с детьми для перестраховки перебралась на Кипр и застряла в эмиграции на более чем полугода.

«Я не могу с февраля писать и рисовать, просто как отняло», – говорит она. Нейросеть стала альтернативным инструментом самовыражения. Сначала Шарлай пользовалась Midjourney для своеобразной арт-терапии, чтобы обуздать эмоции от новостей из Украины. Натренировавшись начала выкладывать результаты творческих переживаний в сеть.

Главная тема Шарлай – выдающиеся события большой войны. Серия артов «Крым: правила ухода за хлопком» появилась, едва подтвердились первые взрывы на военном аэродроме «Саки» на оккупированном полуострове.

Скорость – преимущество нейроарта. Результат появляется через 10 минут после отправки текста боту, говорит Алексей Авилов. Он – инженер украинского стартапа ZibraAI с орбиты Roosh Ventures Сергея Токарева. Еще один бонус – сгенерированные картинки проходят ИИ-фильтры соцсетей, которые в последнее время массово блокируют военный контент.

Вклад ZibraAI в информационную войну – запущенный в конце июня благотворительный проект Sirens Gallery. Это три серии сгенерированных нейросетью артов, из которых сделали благотворительные NFT на блокчейнах Polygon, Ethereum и NEAR. Всего создали 1991 изображение, за самый дорогой лот пока выручили $3000, говорит Head of Growth стартапа Константин Тимощук.

Промежуточный результат Sirens Gallery – собранные 250 000 грн – перечислили на благотворительные проекты платформы dobro.ua Виктора Пинчука. Шарлай тоже отважилась монетизировать сгенерированные работы. Одну из самых популярных серий о херсонских арбузах превратили в набор из 11 печатных открыток за 250 грн. Вся выручка будет передаваться на помощь ВСУ.

Авторские права на творчество алгоритмов – пока серая зона мира юриспруденции. Так что разработчики Midjourney не запрещают людям-соавторам зарабатывать на сгенерированных картинках. Исключение – стартап требует уплаты 20% роялти за продажу NFT и приобретение корпоративной подписки за $600 от компаний с более чем $1 млн годового оборота. Есть ли здесь простор для бизнеса?

Изображение сгенерировано ИИ Midjourney в соавторстве с Марией Шарлай

Изображение сгенерировано ИИ Midjourney в соавторстве с Марией Шарлай Фото Изображение сгенерировано ИИ Midjourney в соавторстве с Марией Шарлай

Ілюстрація Maria Sharlay

Изображение сгенерировано ИИ Midjourney в соавторстве с Марией Шарлай Фото Ілюстрація Maria Sharlay

Как пылает Кремль. Нейросети генерируют картины из текста и помогают собирать на ВСУ. Может ли нейроарт стать бизнесом /Фото 1

Изображение сгенерировано ИИ Midjourney в соавторстве с Марией Шарлай

Как пылает Кремль. Нейросети генерируют картины из текста и помогают собирать на ВСУ. Может ли нейроарт стать бизнесом /Фото 2

Сгенерировано ИИ Midjourney в соавторстве с Марией Шарлай

Как пылает Кремль. Нейросети генерируют картины из текста и помогают собирать на ВСУ. Может ли нейроарт стать бизнесом /Фото 3

Изображение сгенерировано ИИ Midjourney в соавторстве с Марией Шарлай

Как пылает Кремль. Нейросети генерируют картины из текста и помогают собирать на ВСУ. Может ли нейроарт стать бизнесом /Фото 4

Изображение сгенерировано ИИ Midjourney в соавторстве с Марией Шарлай

Как пылает Кремль. Нейросети генерируют картины из текста и помогают собирать на ВСУ. Может ли нейроарт стать бизнесом /Фото 5

Изображение сгенерировано ИИ Midjourney в соавторстве с Марией Шарлай, коллаж Александра Карасева

Ілюстрація Maria Sharlay

Изображение сгенерировано ИИ Midjourney в соавторстве с Марией Шарлай Фото Ілюстрація Maria Sharlay

Ілюстрація Maria Sharlay

Изображение сгенерировано ИИ Midjourney в соавторстве с Марией Шарлай Фото Ілюстрація Maria Sharlay

Ілюстрація Maria Sharlay

Изображение сгенерировано ИИ Midjourney в соавторстве с Марией Шарлай Фото Ілюстрація Maria Sharlay

Ілюстрація Maria Sharlay

Изображение сгенерировано ИИ Midjourney в соавторстве с Марией Шарлай Фото Ілюстрація Maria Sharlay

Как пылает Кремль. Нейросети генерируют картины из текста и помогают собирать на ВСУ. Может ли нейроарт стать бизнесом /Фото 6

Изображение сгенерировано ИИ Stable Diffusion

Как пылает Кремль. Нейросети генерируют картины из текста и помогают собирать на ВСУ. Может ли нейроарт стать бизнесом /Фото 7

Изображение сгенерировано ИИ DALL-E 2

Как пылает Кремль. Нейросети генерируют картины из текста и помогают собирать на ВСУ. Может ли нейроарт стать бизнесом /Фото 8

Изображение сгенерировано ИИ DALL-E 2

Предыдущий слайд
Следующий слайд

Кто уже научился зарабатывать на нейросетях?

Хайп вокруг создания картинок в тексте начал OpenAI – основанный Илоном Маском и Сэмом Альтманом разработчик GPT-3. Это один из самых мощных на сегодняшний день алгоритмов, который работает с естественным языком и может создавать тексты, похожие на написанные человеком. Следующей ступенью стала презентованная в январе 2021-го нейросеть DALL-E.

Первая версия продукта, названного в честь сюрреалиста Сальвадора Дали и харизматичного робота WALL-E из мультика Pixar, делала изображение всего 256 на 256 пикселей. Презентована несколько месяцев спустя преемница DALL-E 2 – вчетверо больше и намного качественнее. После этого прорыва вышла похожая версия ИИ – Imagen от Google, продукт Хольца и вариации менее известных издателей.

Профессиональные иллюстраторы в Twitter страстно дискутируют с технофанатами, называя сгенерированные картинки ненастоящим искусством. Однако бум цифрового арта и сделок вроде продаж работы The Merge художника под псевдонимом Pak за $91,8 млн притих вместе с рынком NFT.

Сами нейростартапы не спешат делиться финансовыми планами и оценкой бизнеса. Хотя треть из «сотен тысяч» пользователей Midjourney профессионально занимается дизайном, приводит размытую статистику компания. «У нас нет инвесторов, у нас нет финансовой мотивации», – говорил Хольц в августовском интервью The Verge. 11 человек команды, по его словам, только хотят работать над крутыми и важными проектами и развлекаться.

OpenAI начал монетизировать DALL-E 2 в июле, когда Альтман объявил о первых 100 000 пользователях. Ежемесячно они получают внутреннюю валюту – кредиты, которые тратятся на генерацию изображений. Если бесплатного лимита не хватает, новую порцию нужно докупить за $15. Следующая цель – 1 млн пользователей, написал основатель в Twittwer.

«История Мира», сгенерированная ИИ – нейросетью Neural Synesthesia

Между тем, на сцене текстовой генерации становится все теснее – «убийцу» предшественников под названием Stable Diffusion презентовал лондонский Stability AI. «DALL-E 2 был фантастическим опытом, но Stable Diffusion примерно в 30 раз эффективнее», – хвастается в интервью техноблогеру Яннику Килчеру основатель стартапа Эмад Мостаке. Фишка его алгоритма – фотореалистичность полученных изображений. В то же время конкуренты имитируют известные художественные стили, установив более жесткие предохранители от создания дипфейков.

Мостаке – выпускник Оксфорда с бэкграундом в инвестотрасли – решил справляться без венчурного капитала. «Никаких миллиардеров, крупных фондов, правительств или любого другого, кто контролировал бы компанию или поддерживаемые ею коммьюнити», – написал он в открытом письме. Бизнес-модель стартапа он тоже не раскрывает.

«Stable Diffusion будет апогеем, потом это можно будет немного улучшать», – считает Авилов из ZibraAI. Он дорабатывал нейросеть для Sirens Gallery, созданную на основе решений с открытым кодом. Следующий уровень – генерация видео по текстовым описаниям. О создании такой нейросети под названием Transframer уже объявил Google.

Цель ZibraAI – заскочить еще дальше в нишу генерации 3D с помощью искусственного интеллекта. Проект Александра Петренко и партнера Roosh Дэна Дмитренко целит в бизнес-аудиторию и делает инструменты, которые упрощают и полуавтоматизируют создание спецэффектов при разработке компьютерных игр. Наработка уже есть. Один из первых готовых продуктов – плагин Zibra Liquids – помогает моделировать жидкость в режиме реального времени.

Материалы по теме

Вы нашли ошибку или неточность?

Оставьте отзыв для редакции. Мы учтем ваши замечания как можно скорее.

Предыдущий слайд
Следующий слайд