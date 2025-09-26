Чому український бізнес не використовує власні дані як товар та як скористатися цією можливістю? Розповідає Олексій Вигодський, Head of Enterprise Applications and Technologies у MODUS X.

Україна володіє неоціненним ресурсом даних, але поки що не вміє їх монетизувати. На відміну від США, де такі компанії, як Neon і Stack Overflow, вже перетворюють дані на прибуток через API, підписки та роялті, Україна не користується цим потенціалом.

У світі, де дані стали новою нафтою, Україна сидить на золотому родовищі і поки що не видобуває з нього жодного грама «золота». Мобільні оператори знають, де й коли переміщуються мільйони людей. Банки бачать транзакції майже кожної родини. Державні реєстри фіксують угоди з нерухомістю та автомобілями. Всі ці масиви лежать на серверах, але рідко перетворюються на гроші.

З іншого боку – тисячі компаній, яким дані потрібні щодня для ухвалення рішень. Підприємець, що відкриває кав’ярню, хоче знати трафік біля конкретного будинку, середній чек у певному кварталі міста, рівень конкуренції. Ці дані вже існують у розрізненому вигляді, але ринок досі не зводить продавців і покупців.

Ринок даних в Україні поки що не працює

Головна проблема – відсутність розуміння, що саме продавати і як це використовувати. Компанії мислять категоріями «продати гігабайти» чи «зробити вивантаження за рядками». У США ж та інших країнах дані є товаром із доданою вартістю: токени запитів, агреговані вибірки, прогнози, API-доступи.

Там ринок даних функціонує і приносить мільйони.

Сім моделей монетизації даних, які вже працюють у США

Прямі ліцензії. Доступ до корпусу даних за моделлю франшизи: фіксована плата + роялті.

Ризик: невизначеність авторських прав.

Приклад №1: угоди медіа з ШІ-розробниками (The New York Times vs OpenAI).

Приклад №2: угоди форум-платформ із ШІ-розробниками (Stack Overflow, Quora – OpenAI, Google).

Підписка на API або токени. Оплата за кожен запит або цитування. Зручніше, ніж продаж «за гігабайтами».

Ризик: зростання витрат на інфраструктуру.

Приклад №1: компанія Neon платить користувачам до 30 центів за кожну хвилину записаного ними діалогу з іншою людиною через мобільний телефон. Отримані дані перепродують іншим компаніям для навчання моделей штучного інтелекту. Користувач може заробляти до $30 на день.

Приклад №2: консорціум Dataset Providers Alliance ліцензує дані за моделлю opt-in, продаючи доступ до даних виключно за згодою правовласника, підвищуючи прозорість угоди між її учасниками.

Data marketplaces. Маркетплейси спеціалізованих датасетів із підпискою. Дають можливість отримати готові набори даних під конкретну індустрію: ритейл, телеком, медіа.

Ризик: законність використання та складність оцінки цінності даних.

Приклад: аналітична платформа Datawiz BES надає доступ до датасетів, релевантних для телекому та ритейлу, а також інструментів для їх аналізу.

Clean rooms / Fine-tuning as a service. Замість передачі даних зовнішньому постачальнику, обчислювальне середовище з ШІ-моделлю розгортається безпосередньо в місці їх зберігання – на стороні клієнта або у контрольованій інфраструктурі. Це дає змогу навчати моделі у безпечному середовищі з дотриманням юридичних і комплаєнс-вимог.

Ризик: витоки даних під час виведення, які може бути використано для атак типу membership inference або model inversion.

Приклад: компанія LiveRamp пропонує ізольовані середовища (Safe Haven), інструменти для спільного аналізу даних, псевдонімізацію та інші рішення, що дозволяють клієнтам безпечно взаємодіяти з даними без їх повної передачі.

Роялті за результат (Output-linked royalties). Постачальник даних отримує оплату лише тоді, коли його дані реально використано у фінальній відповіді або виведенні моделі.

Ризик: атрибуція – складно точно визначити, які саме частини даних вплинули на результат, особливо у великих моделях із багатьма джерелами.

Приклад: ШІ-платформа Perplexity пропонує модель, де видавці контенту можуть отримувати частку доходу, коли їхні матеріали використовуються у результатах пошукових запитів на платформі.

Data unions / trusts. Окремі користувачі або малий бізнес об’єднують свої дані колективно (в трасти) і пропонують їх пакетом за винагороду, яка розподіляється між учасниками.

Ризики:

управління: складно забезпечити прозорий облік внеску та справедливий розподіл доходів;

регуляція: необхідність дотримання законів про захист даних і контроль ризиків повторної ідентифікації.

Приклад №1: Swash – браузерне розширення, яке збирає активність користувача, об’єднує її у Data Union і розподіляє дохід від продажу агрегованих даних.

Приклад №2: DIMO – платформа IoT / автомобільних даних: власники авто підключають пристрій чи застосунок, дають згоду на збір даних і отримують винагороду; дані агрегуються та продаються третім сторонам.

Корпоративний «замок на даних». Компанія ізолює власні first-party-дані та використовує їх як основу для розробки й ліцензування продуктів.

Ризик: висока вартість зберігання, обробки та підтримки інфраструктури.

Приклад: Dow Jones / Factiva розширив маркетплейс ШІ-контенту, надавши понад 5000 видавництвам можливість ліцензувати свій контент компаніям. Це приклад закритої моделі роботи з first-party-даними та їх комерційного використання.

Еволюція ринку на практиці

Наведені вище моделі не виникли на порожньому місці. Ринок пройшов фазу проб і помилок: у США та Європі перші схеми навчання LLM-моделей будувалися поспіхом, без чіткої фіксації прав власників даних і обмежень для зовнішніх користувачів. Багато джерел даних: медіа, фотографи, дослідницькі організації, не були юридично готові захищати свої інтереси. Технологічні ж компанії діяли доволі самовпевнено, використовуючи будь-які доступні масиви, не зважаючи на наслідки.

Результатом стали гучні конфлікти інтересів і судові процеси: від NYT проти OpenAI до Getty проти Stability AI. Ці кейси показали: без прозорих договорів і правил ринок неминуче скочується у спори.

Для України це сигнал: власникам даних варто вже зараз на рівні публічних оферт, ліцензій і правил використання формувати юридичні механізми захисту. Щоб завтра не довелося наздоганяти ринок через суди.

Втім, саме ці конфлікти стали поштовхом до дорослішання індустрії. Під тиском позовів і репутаційних ризиків технологічні компанії та власники даних почали вибудовувати більш зрілі підходи: з’явилися прозорі ліцензії, підписка на API, дата-маркетплейси з юридичними гарантіями, захищені clean rooms для навчання моделей. Дані перестали сприйматися як безплатне «паливо» й перетворилися на юридично оформлений актив, довкола якого будуються стійкі бізнес-екосистеми.

Для України це особливо важливо: ми можемо взяти вже готові практики, які на Заході народжувалися в судах, і з самого початку вбудувати їх у свої «правила гри» – від стандартів публічних договорів до форматів API-атрибуції та роялті.

Шанс для України

Для України відкривається рідкісне вікно можливостей. Доки США та Європа вчилися на власних помилках і витрачали мільйони у судах, ми можемо стартувати з чистого аркуша.

У нас уже є галузі, що сидять на золотих жилах даних: енергетика, банки, телеком, медіа. Їм достатньо не продавати «сирі байти», а оформити їх у продукти:

machine-readable-ліцензії у договорах;

об’єднання медіакомпаній у data unions;

захищені clean rooms для навчання моделей;

справедливі схеми роялті та API-атрибуції.

Такий підхід перетворює дані не на ризик, а на капітал. Головне питання – чи встигнемо ми скористатися цим вікном, доки воно відкрите.

Практичний чекліст, що робити вже зараз:

Медіа та автори: провести інвентаризацію прав, виставити machine-readable-ліцензії, визначити стратегію – йти до суду чи укладати угоди з користувачами даних, зокрема технологічними компаніями.

Компанії – покупці ШІ: закладати DPIA, вимагати гарантії походження даних, резервувати бюджет на юридичні витрати.

Провайдери ШІ: публікувати data cards, вибудовувати процеси реагування на позови, запускати API для атрибуції та роялті.

Дані – це не байти і не рядки. Це нова нафта, ба навіть більше – це мова переговорів та інструмент побудови конкурентних стратегій.

Україна має і джерела, і попит, і унікальний шанс перестрибнути «дитячі хвороби» ринку. Чи скористаємося ми цим шансом, або ж будемо торгувати «сирим сировинним продуктом», коли світ давно платить за готові рішення?