Стенфорд, третій турнір ImageNet Large Scale, 2012 рік. Учасники конкурсу – алгоритми. Вони змагаються в умінні розпізнавати зображення. Професор Фей‑Фей Лі зібрала 3,2 млн картинок у 5247 категоріях – від котів до столів. Дебютні результати далекі від ідеалу: на перших змаганнях алгоритми всіх команд помилялися мінімум у 25% випадків. У 2012 році все змінюється – нейромережа AlexNet виривається вперед, домігшись точності в 16,4%. Ця перемога стає доленосною.
Amazon інвестує мільярди доларів у ШІ, роботів та машинне навчання. Якими принципами й правилами керується компанія?
Дізнайтеся вже 22 листопада на Forbes Tech 2024. Купуйте квиток за посиланням!
AlexNet розробила команда з Університету Торонто: професор Джефф Хінтон і двоє його студентів, Ілля Суцкевер і канадець українського походження Алекс Крижевський. Через п’ять років після їхньої перемоги конкурс ImageNet просто закрили, оскільки 29 з 38 алгоритмів уже працювали з точністю понад 98%.
«Це був справжній прорив, бо всі побачили, як застосовувати нейронні мережі на практиці», – натхненно розповідає про AlexNet технічний директор українського стартапу Reface Олесь Петрів, 30. Він з командою зробив додаток, який уміє замінювати обличчя на картинках і GIF-анімаціях, реалістично змінюючи риси знаменитостей чи акторів.
У програми понад 45 млн завантажень, серед користувачів – Ілон Маск, Джастін Бібер, Брітні Спірс. 1 вересня 2020 року Reface взяв раніше недосяжну для українців висоту: став найпопулярнішим iOS‑додатком у США, обігнавши TikTok, Netflix, Zoom та інших іменитих конкурентів. Чим українці зацікавили решту світу?
Випускники Могилянки Роман Могильний, Олесь Петрів та Ярослав Бойко працюють разом з 2011 року. Їхний перший стартап Neocortext спеціалізувався на машинному навчанні. «Ми були студією вільних художників»,– розповідає нинішній CEO Reface Могильний, 29. Neocortext налаштовували алгоритми, щоб аналізувати тональність голосу, конвертувати двовимірні зображення у тривимірні для голлівудських студій, генерувати описи до зображень.
У 2018 році на запит одного з клієнтів стартапери розробили алгоритм для заміни облич на фотографіях. Створення face swap роликів – синтезованих алгоритмами зображень, на яких змінюються риси обличчя,– виявилося золотою жилою. Кому не цікаво побачити себе на місці героя улюбленого фільму або кліпу?
Відповідь на це риторичне питання стало провідною ідеєю для вільних художників з Могилянки. До них так звані дипфейки були заняттям продакшн‑студій або просунутих ентузіастів. «Ролик студійної якості міг коштувати десятки тисяч доларів,– розповідає Могильний.– Ми хотіли вкласти цю технологію в руки звичайним людям». Вклали. У вересні 2020 року користувачі Reface створювали до 20 млн роликів щодня.
Перший додаток, Reflect, дозволяв змінювати риси обличчя на фотографіях. Друга програма, Doublicat, працювала вже з GIF‑анімаціями. У 2019 році її, як і компанію, перейменували в Reface. До того моменту розширилася й команда. До батьків‑засновників додалося ще четверо партнерів: Дмитро Швець, Іван Алцибеєв, Денис Дмитренко та Кирило Сигида.
У скільки обійшлася розробка продукту, фаундери не розкривають. Упершій половині 2020 року стартап отримав конвертовану позику від фонду Adventures Labs. Повернути її можна грошима або акціями під час наступного раунду. Раннім інвестором проєкту є Сергій Токарєв– засновник компанії Lucky Labs, яка займається розробкою для гемблінг‑індустрії. З 2017‑го по травень 2020‑го Токарєв перебував у санкційному списку Ради національної безпеки і оборони.
Головна відмінність Reface від конкурентів – швидкість обробки і якість контенту. У бібліотеці додатка є сцени з популярних серіалів. Своє обличчя можна домалювати Бреду Пітту, Леонардо ДіКапріо, Олегу Виннику або Леді Газі. Ліцензують усе за обопільною згодою і поки що найчастіше безкоштовно. «Для творців контенту наш додаток – спосіб просувати свій продукт»,– розповідає Могильний.
Користувачі Reface у 65% випадків діляться результатом у соцмережах. Це хороший знак для всіх, хто шукає промо. Наприклад, колаборацію з Reface до релізу нового кліпу випустив музикант Джон Ледженд. Скільки це може коштувати на комерційних умовах? Від $10 000, неохоче відповідає Могильний. «А втім, давайте у цьому інтерв’ю без цифр»,– додає він.
Reface заробляє переважно на підписці. За $2,5 на тиждень, $3,99 на місяць або $24,99 на рік користувачі можуть робити безлімітну кількість «рефейсів», завантажувати власні GIF для обробки й експортувати все без водяного знаку додатка. Якщо не заплатити, доведеться дивитися рекламу. У серпні, за оцінкою аналітичної платформи SensorTower, програма виручила $2 млн в AppStore і $1 млн в Google Store. «Працюємо в нуль,– розповідає директор з розвитку бізнесу Дмитро Швець.– Усе зароблене вкладаємо у розвиток». У компанії понад 60 співробітників.
Фаундери кажуть, що, на відміну від колег із пострадянських країн, роблять Reface не на продаж. Хоча могли б. Facebook купив білоруський проєкт MSQRD зі створення масок. Росіянин Віктор Шабуров продав Snapchat дві компанії на суму понад $300 млн. «Ми заробляємо самостійно і не плануємо продаватися», – наголошує Денис Дмитренко, який відповідає за взаємини з інвесторами. За його словами, у стартапу майже необмежений доступ до капіталу– інвестиції готові дати провідні світові фонди. Пропозиції купити компанію теж звучали, говорить Могильний.
«У них класна технологія і команда. Але їм потрібна велика впевненість у тому, що Google або Facebook ще не знайшли, як це повторити»,– каже засновник інтернет‑компанії Nika Tech Family Максим Слободянюк.
Один з менторів команди Reface – білорус Юрій Гурський. Він був інвестором MSQRD, а пізніше вклався в стартап з обробки фотографій за допомогою нейромереж Prisma. Ця програма потрапила на вершину AppStore на початку 2016 року, після чого Mail.Ru Group проінвестувала в компанію при оцінці близько $20 млн. За кілька місяців програма вилетіла з ешелону найбільш скачуваних. Гурський з часом зробив на її базі додаток з обробки селфі Lensa. У середині 2019‑го той приносив йому $0,5 млн на місяць. Сьогодні вартість компанії Palta, яка керує всіма його активами, Гурський оцінює в $200 млн. Основну капіталізацію дає частка в трекері менструацій Flo, який коштує понад $230 млн. Заробітки у програми співставні з Reface – у серпні продажі Flo в AppStore принесли $2 млн, оцінює SensorTower.
Міцно поставити розважальний проєкт на ноги – половина успіху. «Такого роду програми не можуть постійно бути на висоті всіх чартів, тому необхідно працювати над продуктом, утримувати користувачів»,– казав у 2017 році співзасновник Prisma Олексій Моісеєнков. Засновники Reface в курсі цієї проблеми. «Ми прекрасно розуміємо, що не можна постійно бути на хвилі, – говорить Могильний. – Просто ми запустимо не одну хвилю». За його словами, користувачі відкрили для себе максимум 10% можливостей Reface.
До кінця року компанія дозволить завантажувати користувачам власні відео, а потім випустить інструмент для заміни всього тіла, а не тільки облич. На думку Петріва, як технологія вони випереджають ринок мінімум на рік. Керівник з розробки одного з конкуруючих додатків погоджується з висновком. «Про перенесення облич написано чимало статей,– каже він.– Усе впирається в те, що треба це зробити в режимі реального часу, на пристрої».
Мозок Reface – так звана генеративно‑змагальна нейромережа (GAN). Цей тип алгоритмів складається з двох компонентів, які змагаються між собою: генератор створює підроблені кадри, а дискримінатор намагається їх розрізняти. Під час навчання картинки стають настільки реалістичними, що дискримінатор уже не може відрізнити їх від підробки. Це означає, що якість дипфейка – прийнятна і для людини.
У Reface між генератором і дискримінатором розташовані десятки додаткових програмних прошарків, які краще розпізнають риси обличчя і змінюють їх. Ключ до успіху– вдало перенести очі, губи, ніс, за якими й формується впізнаваність. Поки що розрахунки відбуваються у хмарі, в майбутньому компанія хоче перенести їх локально, на пристрій. «Головне – зрозуміти, як залишити вихідний код на смартфоні і не допустити його крадіжки конкурентами, – говорить Петрів.– Але у нас є дуже елегантне рішення».
Крім споживчого ринку, в Reface думають і про бізнес‑аудиторію. Компанія розробляє сервіс Reface Studio. Він обіцяє у десятки разів здешевити процес постпродакшна при зйомках, замінюючи обличчя акторів у хорошій якості і з великою кількістю налаштувань. «Крупні плани так знімати поки зарано, але багато в чому технологія буде дуже корисна індустрії. Це дешевше класичного CGI», – говорить Могильний. Reface Studio тестують в обмеженому режимі, грошей це ще не приносить.
В епоху постправди можливість зробити дипфейк на смартфоні – небезпечна зброя. «Для нас етичність розробки – не пусте слово, ми багато над цим думаємо», – говорить Могильний. Поки що придумали суворо заборонити використання свого софту для створення політичного, порнографічного та будь ‑якого іншого контенту, здатного завдати шкоди людям. Система модерації, яка відслідковуватиме поведінку користувачів – Reface Check – поки розробляється.
Вона запрацює після того, як користувачі отримають доступ до завантаження своїх відео. Reface Check розпізнаватиме дипфейки «свого» виробництва. Для цього в зображення буде вбудовано невидимий оку, але доступний іншому алгоритмому «водяний знак». Якщо у користувача виникнуть сумніви в достовірності ролика, він зможе перевірити його на сайті Reface. Великі платформи на кшталт Google або Facebook зможуть отримати доступ до перевірки за API, говорять у компанії.
Опубліковано в четвертому номері журналу Forbes (жовтень 2020)
Ви знайшли помилку чи неточність?
Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.