Нейромережі, що генерують картинки із тексту – технологічний хіт останнього року. В Україні вони стали ще одним інструментом інформаційної війни. Алгоритми DALL-E 2, Imagen, Midjourney та Stable Diffusion вже конкурують за користувачів, хоча ринок лише формується. Як вони будують на цьому бізнес
Amazon інвестує мільярди доларів у ШІ, роботів та машинне навчання. Якими принципами й правилами керується компанія?
Дізнайтеся вже 22 листопада на Forbes Tech 2024. Купуйте квиток за посиланням!
«Близько 500 перших спроб я витратила, щоб лише подивитися усі варіанти того, як палає Кремль», – розповідає про своє захоплення генеративною нейромережею Midjourney киянка Марія Шарлай. Створені штучним інтелектом (ШІ) картинки на тему українсько-російської війни вона регулярно постить у соцмережах.
Midjourney – стартап американця з математичною освітою Девіда Хольца, який називає себе серійним підприємцем. Його попередню компанію – 12-річного розробника рішень для віртуальної й доповненої реальності Leap Motion – у 2019-му придбав конкурент Ultrahaptics. На піку дітище Хольца та його кофаундера Майкла Баквальда оцінювалося у $306 млн, але надприбутків компанія не приносила, тож продали його вдесятеро дешевше.
Новий проєкт Хольца, над яким засновник офіційно працює трохи більше року, відкрився для всіх охочих у липні 2022-го. Це так звана text-to-image нейромережа, що створює зображення із тексту. Опис того, що має бути на картинці, потрібно надіслати штучному інтелекту через бота у месенджері Discord. Пробний період безкоштовний. Місячна підписка, що дає доступ і до вебверсії сервісу, коштує $10–30.
«Це найкращі $30 у житті, що я витратила на мистецтво», – каже Шарлай. Професійною художницею вона себе не вважає – творчістю займалася радше задля задоволення. Випускниця столичного архітектурного університету КНУБА дев’ять років пропрацювала комунікаційницею у маркетинговій агенції Aimbulance. Напередодні російського вторгнення разом із дітьми для перестраховки перебралася на Кіпр і застрягла в еміграції на понад пів року.
«Я не можу з лютого писати і малювати, просто як відняло», – каже вона. Нейромережа стала альтернативним інструментом самовираження. Спочатку Шарлай користувалася Midjourney для своєрідної арт-терапії, щоб приборкати емоції від новин з України. Натренувавшись почала викладати результати творчих переживань у мережу.
Головна тема Шарлай – визначні події великої війни. Серія артів «Крим: правила догляду за бавовною» з’явилася, ледве підтвердилися перші вибухи на військовому аеродромі «Саки» на окупованому півострові.
Швидкість – перевага нейроарту. Результат з’являється хвилин через 10 після відправки тексту боту, каже Олексій Авілов. Він – інженер українського стартапу ZibraAI із орбіти Roosh Ventures Сергія Токарєва. Ще один бонус – згенеровані картинки проходять ШІ-фільтри соцмереж, що останнім часом масово блокують воєнний контент.
Внесок ZibraAI в інформаційну війну – запущений наприкінці червня благодійний проєкт Sirens Gallery. Це три серії згенерованих нейромережею артів, з яких зробили благодійні NFT на блокчейнах Polygon, Ethereum та NEAR. Всього створили 1991 зображення, за найдорожчий лот поки виручили $3000, каже Head of Growth стартапу Костянтин Тимощук.
Проміжний результат Sirens Gallery – зібрані 250 000 грн – перерахували на благодійні проєкти платформи dobro.ua Віктора Пінчука. Шарлай теж наважилася монетизувати згенеровані роботи. Одну з її найпопулярніших серій про херсонські кавуни перетворили на набір із 11 друкованих листівок за 250 грн. Весь виторг передаватимуть на допомогу ЗСУ.
Авторські права на творчість алгоритмів – поки сіра зона світу юриспруденції. Тож розробники Midjourney не забороняють людям-співавторам заробляти на згенерованих картинках. Виняток – стартап вимагає сплати 20% роялті за продаж NFT і придбання корпоративної підписки за $600 від компаній із понад $1 млн річного обороту. Чи є тут простір для бізнесу?
Хтось вже навчився заробляти на нейромережах?
Хайп навколо створення картинок з тексту започаткував OpenAI – заснований Ілоном Маском і Семом Альтманом розробник GPT-3. Це однин із найпотужніших на сьогодні алгоритмів, що працює із природною мовою і може створювати тексти, схожі на написані людиною. Наступним щаблем стала презентована у січні 2021-го нейромережа DALL-E.
Перша версія продукту, названого на честь сюрреаліста Сальвадора Далі та харизматичного робота WALL-E із мультику Pixar, робила зображення всього 256 на 256 пікселів. Презентована кілька місяців потому наступниця DALL-E 2 – вчетверо більші і набагато якісніші. Після цього прориву вийшла схожа версія ШІ – Imagen від Google, продукт Хольца і варіації менш відомих видавців.
Професійні ілюстратори у Twitter палко дискутують із технофанатами, називаючи згенеровані картинки несправжнім мистецтвом. Проте бум цифрового арту й угод на кшталт продажу роботи The Merge художника під псевдонімом Pak за $91,8 млн притих разом із ринком NFT.
Самі нейростартапи не поспішають ділитися фінансовими планами й оцінкою бізнесу. Хоча третина із «сотень тисяч» користувачів Midjourney професійно займається дизайном, наводить розмиту статистику компанія. «У нас немає інвесторів, ми не маємо фінансової мотивації», – казав Хольц у серпневому інтерв’ю The Verge. 11 людей команди, за його словами, лише хочуть працювати над крутими й важливими проєктами та розважатися.
OpenAI почав монетизувати DALL-E 2 у липні, коли Альтман оголосив про перших 100 000 користувачів. Щомісяця вони отримують внутрішню валюту – кредити, які витрачаються на генерацію зображень. Якщо безкоштовного ліміту не вистачає, нову порцію треба докупити за $15. Наступна ціль – 1 млн користувачів, написав засновник у Twittwer.
Тим часом на сцені текстової генерації стає дедалі тісніше – «вбивцю» попередників під назвою Stable Diffusion презентував лондонський Stability AI. «DALL-E 2 був фантастичним досвідом, але Stable Diffusion приблизно в 30 разів ефективніший», – вихваляється в інтерв’ю техноблогеру Янніку Кілчеру засновник стартапу Емад Мостаке. Фішка його алгоритму – фотореалістичність отриманих зображень. Водночас конкуренти імітують відомі художні стилі, встановивши жорсткіші запобіжники від створення діпфейків.
Мостаке – випускник Оксфорду із бекграундом у інвестгалузі – вирішив справлятися без венчурного капіталу. «Жодних мільярдерів, великих фондів, урядів чи будь-кого іншого, хто контролював би компанію чи підтримувані нею ком’юніті», – написав він у відкритому листі. Бізнес-модель стартапу він також не розкриває.
«Stable Diffusion буде апогеєм, потім це можна буде лише трохи покращувати», – вважає Авілов із ZibraAI. Він допрацьовував нейромережу для Sirens Gallery, створену на основі рішень з відкритим кодом. Наступний рівень – генерація відео за текстовими описами. Про створення такої нейромережі під назвою Transframer вже оголосив Google.
Мета ZibraAI – заскочити ще далі, у нішу генерації 3D за допомогою штучного інтелекту. Проєкт Олександра Петренка та партнера Roosh Дена Дмитренка цілить у бізнес-аудиторію й робить інструменти, що спрощують та напівавтоматизують створення спецефектів при розробці комп’ютерних ігор. Напрацювання вже є. Один із перших готових продуктів – плагін Zibra Liquids – допомагає моделювати рідину у режимі реального часу.
Ви знайшли помилку чи неточність?
Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.