Украина владеет неоценимым ресурсом данных, но пока не умеет их монетизировать. В отличие от США, где такие компании, как Neon и Stack Overflow, уже превращают данные в прибыль через API, подписки и роялти, Украина не пользуется этим потенциалом.
Почему украинский бизнес не использует собственные данные как товар и как воспользоваться этой возможностью? Рассказывает Алексей Выгодский, Head of Enterprise Applications and Technologies в MODUS X.
Покупайте годовую подписку на шесть журналов Forbes Ukraine по цене четырех. Если вы цените качество, глубину и силу реального опыта, эта подписка именно для вас.
В мире, где данные стали новой нефтью, Украина сидит на золотой жиле и пока не добывает из нее ни грамма золота. Мобильные операторы знают, где и когда перемещаются миллионы людей. Банки видят транзакции почти каждой семьи. Государственные реестры фиксируют сделки с недвижимостью и автомобилями. Все эти массивы лежат на серверах, но редко превращаются в деньги.
С другой стороны – тысячи компаний, которым данные нужны каждый день для принятия решений. Предприниматель, открывающий кафе, хочет знать трафик у конкретного дома, средний чек в определенном квартале города, уровень конкуренции. Эти данные уже существуют в разрозненном виде, но рынок до сих пор не сводит продавцов и покупателей.
Рынок данных в Украине пока не работает
Главная проблема – отсутствие понимания, что именно продавать и как использовать. Компании мыслят категориями «продать гигабайты» или «сделать выгрузку по строкам». В США и других странах данные являются товаром с добавленной стоимостью: токены запросов, агрегированные выборки, прогнозы, API-доступы.
Там рынок данных работает и приносит миллионы.
Семь моделей монетизации данных, уже работающие в США
Прямые лицензии. Доступ к корпусу данных по модели франшизы: фиксированная плата + роялти.
Риск: неопределенность авторских прав.
Пример №1: соглашения медиа с ИИ-разработчиками (The New York Times vs OpenAI).
Пример №2: соглашения форум-платформ с ИИ-разработчиками (Stack Overflow, Quora – OpenAI, Google).
Подписка на API или токены. Оплата за каждый запрос или цитирование. Удобнее, чем продажа «по гигабайтам».
Риск: рост расходов на инфраструктуру.
Пример №1: Neon платит пользователям до 30 центов за каждую минуту записанного ими диалога с другим человеком через мобильный телефон. Полученные данные перепродают другим компаниям для обучения моделей искусственного интеллекта. Пользователь может зарабатывать до $30 в день.
Пример №2: консорциум Dataset Providers Alliance лицензирует данные по модели opt-in, продавая доступ к данным исключительно с согласия правообладателя, повышая прозрачность соглашения между его участниками.
Data marketplaces. Маркетплейсы специализированных дата-сетов с подпиской. Дают возможность получить готовые наборы данных под конкретную индустрию: ритейл, телеком, медиа.
Риск: законность использования и сложность оценки ценности данных.
Пример: аналитическая платформа Datawiz BES предоставляет доступ к дата-сетам, релевантным для телекома и ритейла, а также инструментам для их анализа.
Clean rooms / Fine-tuning as a service. Вместо передачи данных внешнему поставщику вычислительная среда с ШИ-моделью разворачивается непосредственно в месте их хранения – на стороне клиента или в контролируемой инфраструктуре. Это позволяет обучать модели в безопасной среде с соблюдением юридических и комплаенс-требований.
Риск: утечки данных при выводе, которые могут быть использованы для атак типа membership inference или model inversion.
Пример: LiveRamp предлагает изолированные среды (Safe Haven), инструменты для совместного анализа данных, псевдонимизацию и другие решения, позволяющие клиентам безопасно взаимодействовать с данными без их полной передачи.
Роялти за результат (Output-linked royalties). Поставщик данных получает оплату только тогда, когда данные реально использованы в финальном ответе или выводе модели.
Риск: атрибуция – сложно точно определить, какие именно части данных повлияли на результат, особенно в больших моделях со многими источниками.
Пример: ИИ-платформа Perplexity предлагает модель, где издатели контента могут получать долю дохода, когда их материалы используются в результатах поисковых запросов на платформе.
Data unions / trusts. Отдельные пользователи или малый бизнес объединяют свои данные коллективно (в трасты) и предлагают их пакетом за вознаграждение, которое распределяется между участниками.
Риски:
- управление: сложно обеспечить прозрачный учет взноса и справедливое распределение доходов;
- регуляция: необходимость соблюдения законов о защите данных и контроле рисков повторной идентификации.
Пример №1: Swash – браузерное расширение, собирающее активность пользователя, объединяющее ее в Data Union и распределяющее доход от продажи агрегированных данных.
Пример №2: DIMO – платформа IoT / автомобильных данных: владельцы авто подключают устройство или приложение, дают согласие на сбор данных и получают вознаграждение; данные агрегируются и продаются третьим сторонам.
Корпоративный «замок на данных». Компания изолирует собственные first-party-данные и использует их в качестве основы для разработки и лицензирования продуктов.
Риск: высокая стоимость хранения, обработки и поддержки инфраструктуры.
Пример: Dow Jones / Factiva расширил маркетплейс ИИ-контента, предоставив более 5000 издательствам возможность лицензировать свой контент компаниям. Это пример закрытой модели работы с first-party-данными и их коммерческого использования.
Эволюция рынка на практике
Вышеприведенные модели не возникли на пустом месте. Рынок прошел фазу проб и ошибок: в США и Европе первые схемы обучения LLM-моделей строились в спешке, без четкой фиксации прав владельцев данных и ограничений для внешних пользователей. Много источников данных: медиа, фотографы, исследовательские организации не были юридически готовы защищать свои интересы. Технологические же компании действовали достаточно самоуверенно, используя любые доступные массивы, без оглядки на последствия.
Результатом стали громкие конфликты интересов и судебные процессы: от NYT против OpenAI до Getty против Stability AI. Эти кейсы показали: без прозрачных договоров и правил рынок неизбежно скатывается в споры.
Для Украины это сигнал: владельцам данных следует уже сейчас на уровне публичных оферт, лицензий и правил использования формировать юридические механизмы защиты. Чтобы завтра не пришлось догонять рынок через суды.
Впрочем, именно эти конфликты послужили толчком к взрослению индустрии. Под давлением исков и репутационных рисков технологические компании и владельцы данных начали выстраивать более зрелые подходы: появились прозрачные лицензии, подписка на API, дата-маркетплейсы с юридическими гарантиями, защищенные clean rooms для обучения моделей. Данные перестали восприниматься как бесплатное «топливо» и превратились в юридически оформленный актив, вокруг которого строятся устойчивые бизнес-экосистемы.
Для Украины это особенно важно: мы можем взять уже готовые практики, которые на Западе рождались в судах, и с самого начала встроить их в свои правила игры – от стандартов публичных договоров до форматов API-атрибуции и роялти.
Шанс для Украины
Для Украины открывается редкое окно возможностей. Пока США и Европа учились на своих ошибках и тратили миллионы в судах, мы можем стартовать с чистого листа.
У нас уже есть отрасли, сидящие на золотых жилах данных: энергетика, банки, телеком, медиа. Им достаточно не продавать «сырые байты», а оформить их в продукты:
- machine-readable-лицензии в договорах;
- объединение медиакомпаний в data unions;
- защищенные clean rooms для обучения моделей;
- справедливые схемы роялти и API атрибуции.
Такой подход превращает данные не в риск, а в капитал. Главный вопрос – успеем ли мы воспользоваться этим окном, пока оно открыто.
Практический чек-лист, что делать уже сейчас:
- Медиа и авторы: провести инвентаризацию прав, выставить machine-readable-лицензии, определить стратегию – идти в суд или заключать соглашения с пользователями данных, в том числе технологическими компаниями.
- Компании – покупатели ИИ: закладывать DPIA, требовать гарантии происхождения данных, резервировать бюджет на юридические расходы.
- Провайдеры ИИ: публиковать data cards, выстраивать процессы реагирования на иски, запускать API для атрибуции и роялти.
Данные – это не байты и не строчки. Это новая нефть, даже больше – это язык переговоров и инструмент построения конкурентных стратегий.
У Украины есть и источники, и спрос, и уникальный шанс перепрыгнуть «детские болезни» рынка. Воспользуемся ли мы этим шансом или будем торговать «сырым сырьевым продуктом», когда мир давно платит за готовые решения?


Вы нашли ошибку или неточность?
Оставьте отзыв для редакции. Мы учтем ваши замечания как можно скорее.