Категорія
Інновації
Дата

Монетизувати дані. Бізнес може заробляти мільйони на невидимому ресурсі. Проблема – несформований ринок даних. Практичний чекліст від Олексія Вигодського із MODUS X

5 хв читання

великі дані, дані, інформація, ринок даних /Getty Images

Банки бачать транзакції майже кожної родини. Державні реєстри фіксують угоди з нерухомістю та автомобілями. Всі ці масиви лежать на серверах, але рідко перетворюються на гроші. Фото Getty Images

Україна володіє неоціненним ресурсом даних, але поки що не вміє їх монетизувати. На відміну від США, де такі компанії, як Neon і Stack Overflow, вже перетворюють дані на прибуток через API, підписки та роялті, Україна не користується цим потенціалом.

Чому український бізнес не використовує власні дані як товар та як скористатися цією можливістю? Розповідає Олексій Вигодський, Head of Enterprise Applications and Technologies у MODUS X.

Купуйте річну передплату на шість журналів Forbes Ukraine за ціною чотирьох номерів. Якщо ви цінуєте якість, глибину та силу реального досвіду, ця передплата саме для вас.

У світі, де дані стали новою нафтою, Україна сидить на золотому родовищі і поки що не видобуває з нього жодного грама «золота». Мобільні оператори знають, де й коли переміщуються мільйони людей. Банки бачать транзакції майже кожної родини. Державні реєстри фіксують угоди з нерухомістю та автомобілями. Всі ці масиви лежать на серверах, але рідко перетворюються на гроші.

З іншого боку – тисячі компаній, яким дані потрібні щодня для ухвалення рішень. Підприємець, що відкриває кав’ярню, хоче знати трафік біля конкретного будинку, середній чек у певному кварталі міста, рівень конкуренції. Ці дані вже існують у розрізненому вигляді, але ринок досі не зводить продавців і покупців.

Ринок даних в Україні поки що не працює

Головна проблема – відсутність розуміння, що саме продавати і як це використовувати. Компанії мислять категоріями «продати гігабайти» чи «зробити вивантаження за рядками». У США ж та інших країнах дані є товаром із доданою вартістю: токени запитів, агреговані вибірки, прогнози, API-доступи. 

Там ринок даних функціонує і приносить мільйони.

Сім моделей монетизації даних, які вже працюють у США

Прямі ліцензії. Доступ до корпусу даних за моделлю франшизи: фіксована плата + роялті.

Ризик: невизначеність авторських прав.

Приклад №1: угоди медіа з ШІ-розробниками (The New York Times vs OpenAI).

Приклад №2: угоди форум-платформ із ШІ-розробниками (Stack Overflow, Quora – OpenAI, Google).

Підписка на API або токени. Оплата за кожен запит або цитування. Зручніше, ніж продаж «за гігабайтами».

Ризик: зростання витрат на інфраструктуру.

Приклад №1: компанія Neon платить користувачам до 30 центів за кожну хвилину записаного ними діалогу з іншою людиною через мобільний телефон. Отримані дані перепродують іншим компаніям для навчання моделей штучного інтелекту. Користувач може заробляти до $30 на день.

Приклад №2: консорціум Dataset Providers Alliance ліцензує дані за моделлю opt-in, продаючи доступ до даних виключно за згодою правовласника, підвищуючи прозорість угоди між її учасниками.

Data marketplaces. Маркетплейси спеціалізованих датасетів із підпискою. Дають можливість отримати готові набори даних під конкретну індустрію: ритейл, телеком, медіа.

Ризик: законність використання та складність оцінки цінності даних.

Приклад: аналітична платформа Datawiz BES надає доступ до датасетів, релевантних для телекому та ритейлу, а також інструментів для їх аналізу.

Clean rooms / Fine-tuning as a service. Замість передачі даних зовнішньому постачальнику, обчислювальне середовище з ШІ-моделлю розгортається безпосередньо в місці їх зберігання – на стороні клієнта або у контрольованій інфраструктурі. Це дає змогу навчати моделі у безпечному середовищі з дотриманням юридичних і комплаєнс-вимог.

Ризик: витоки даних під час виведення, які може бути використано для атак типу membership inference або model inversion.

Приклад: компанія LiveRamp пропонує ізольовані середовища (Safe Haven), інструменти для спільного аналізу даних, псевдонімізацію та інші рішення, що дозволяють клієнтам безпечно взаємодіяти з даними без їх повної передачі.

Роялті за результат (Output-linked royalties). Постачальник даних отримує оплату лише тоді, коли його дані реально використано у фінальній відповіді або виведенні моделі.

Ризик: атрибуція – складно точно визначити, які саме частини даних вплинули на результат, особливо у великих моделях із багатьма джерелами.

Приклад: ШІ-платформа Perplexity пропонує модель, де видавці контенту можуть отримувати частку доходу, коли їхні матеріали використовуються у результатах пошукових запитів на платформі.

Data unions / trusts. Окремі користувачі або малий бізнес об’єднують свої дані колективно (в трасти) і пропонують їх пакетом за винагороду, яка розподіляється між учасниками.

Ризики:

  • управління: складно забезпечити прозорий облік внеску та справедливий розподіл доходів;
  • регуляція: необхідність дотримання законів про захист даних і контроль ризиків повторної ідентифікації.

Приклад №1: Swash – браузерне розширення, яке збирає активність користувача, об’єднує її у Data Union і розподіляє дохід від продажу агрегованих даних.

Приклад №2: DIMO – платформа IoT / автомобільних даних: власники авто підключають пристрій чи застосунок, дають згоду на збір даних і отримують винагороду; дані агрегуються та продаються третім сторонам.

Корпоративний «замок на даних». Компанія ізолює власні first-party-дані та використовує їх як основу для розробки й ліцензування продуктів.

Ризик: висока вартість зберігання, обробки та підтримки інфраструктури.

Приклад: Dow Jones / Factiva розширив маркетплейс ШІ-контенту, надавши понад 5000 видавництвам можливість ліцензувати свій контент компаніям. Це приклад закритої моделі роботи з first-party-даними та їх комерційного використання.

Еволюція ринку на практиці 

Наведені вище моделі не виникли на порожньому місці. Ринок пройшов фазу проб і помилок: у США та Європі перші схеми навчання LLM-моделей будувалися поспіхом, без чіткої фіксації прав власників даних і обмежень для зовнішніх користувачів. Багато джерел даних: медіа, фотографи, дослідницькі організації, не були юридично готові захищати свої інтереси. Технологічні ж компанії діяли доволі самовпевнено, використовуючи будь-які доступні масиви, не зважаючи на наслідки.

Результатом стали гучні конфлікти інтересів і судові процеси: від NYT проти OpenAI до Getty проти Stability AI. Ці кейси показали: без прозорих договорів і правил ринок неминуче скочується у спори. 

Для України це сигнал: власникам даних варто вже зараз на рівні публічних оферт, ліцензій і правил використання формувати юридичні механізми захисту. Щоб завтра не довелося наздоганяти ринок через суди.

Втім, саме ці конфлікти стали поштовхом до дорослішання індустрії. Під тиском позовів і репутаційних ризиків технологічні компанії та власники даних почали вибудовувати більш зрілі підходи: з’явилися прозорі ліцензії, підписка на API, дата-маркетплейси з юридичними гарантіями, захищені clean rooms для навчання моделей. Дані перестали сприйматися як безплатне «паливо» й перетворилися на юридично оформлений актив, довкола якого будуються стійкі бізнес-екосистеми.

Для України це особливо важливо: ми можемо взяти вже готові практики, які на Заході народжувалися в судах, і з самого початку вбудувати їх у свої «правила гри» – від стандартів публічних договорів до форматів API-атрибуції та роялті.

Шанс для України

Для України відкривається рідкісне вікно можливостей. Доки США та Європа вчилися на власних помилках і витрачали мільйони у судах, ми можемо стартувати з чистого аркуша.

У нас уже є галузі, що сидять на золотих жилах даних: енергетика, банки, телеком, медіа. Їм достатньо не продавати «сирі байти», а оформити їх у продукти:

  • machine-readable-ліцензії у договорах;
  • об’єднання медіакомпаній у data unions;
  • захищені clean rooms для навчання моделей;
  • справедливі схеми роялті та API-атрибуції.

Такий підхід перетворює дані не на ризик, а на капітал. Головне питання – чи встигнемо ми скористатися цим вікном, доки воно відкрите.

Практичний чекліст, що робити вже зараз:

  • Медіа та автори: провести інвентаризацію прав, виставити machine-readable-ліцензії, визначити стратегію – йти до суду чи укладати угоди з користувачами даних, зокрема технологічними компаніями.
  • Компанії – покупці ШІ: закладати DPIA, вимагати гарантії походження даних, резервувати бюджет на юридичні витрати.
  • Провайдери ШІ: публікувати data cards, вибудовувати процеси реагування на позови, запускати API для атрибуції та роялті.

Дані – це не байти і не рядки. Це нова нафта, ба навіть більше – це мова переговорів та інструмент побудови конкурентних стратегій.

Україна має і джерела, і попит, і унікальний шанс перестрибнути «дитячі хвороби» ринку. Чи скористаємося ми цим шансом, або ж будемо торгувати «сирим сировинним продуктом», коли світ давно платить за готові рішення?

Матеріали по темі
Контриб'ютори співпрацюють із Forbes на позаштатній основі. Їхні тексти відображають особисту точку зору. У вас інша думка? Пишіть нашій редакторці Тетяні Павлушенко – [email protected]

Ви знайшли помилку чи неточність?

Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.

Попередній слайд
Наступний слайд
Четвертий випуск 2025 року вже у продажу

Замовляйте з безкоштовною доставкою по Україні