Категория
Инновации
Дата

Монетизировать данные. Бизнес может зарабатывать миллионы на невидимом ресурсе. Проблема – несформированный рынок данных. Практический чек-лист от Алексея Выгодского из MODUS X

5 хв читання

великі дані, дані, інформація, ринок даних /Getty Images

Банки видят транзакции почти каждой семьи. Государственные реестры фиксируют сделки с недвижимостью и автомобилями. Все эти массивы лежат на серверах, но редко превращаются в деньги. Фото Getty Images

Украина владеет неоценимым ресурсом данных, но пока не умеет их монетизировать. В отличие от США, где такие компании, как Neon и Stack Overflow, уже превращают данные в прибыль через API, подписки и роялти, Украина не пользуется этим потенциалом.

Почему украинский бизнес не использует собственные данные как товар и как воспользоваться этой возможностью? Рассказывает Алексей Выгодский, Head of Enterprise Applications and Technologies в MODUS X.

Покупайте годовую подписку на шесть журналов Forbes Ukraine по цене четырех. Если вы цените качество, глубину и силу реального опыта, эта подписка именно для вас.

В мире, где данные стали новой нефтью, Украина сидит на золотой жиле и пока не добывает из нее ни грамма золота. Мобильные операторы знают, где и когда перемещаются миллионы людей. Банки видят транзакции почти каждой семьи. Государственные реестры фиксируют сделки с недвижимостью и автомобилями. Все эти массивы лежат на серверах, но редко превращаются в деньги.

С другой стороны – тысячи компаний, которым данные нужны каждый день для принятия решений. Предприниматель, открывающий кафе, хочет знать трафик у конкретного дома, средний чек в определенном квартале города, уровень конкуренции. Эти данные уже существуют в разрозненном виде, но рынок до сих пор не сводит продавцов и покупателей.

Рынок данных в Украине пока не работает

Главная проблема – отсутствие понимания, что именно продавать и как использовать. Компании мыслят категориями «продать гигабайты» или «сделать выгрузку по строкам». В США и других странах данные являются товаром с добавленной стоимостью: токены запросов, агрегированные выборки, прогнозы, API-доступы.

Там рынок данных работает и приносит миллионы.

Семь моделей монетизации данных, уже работающие в США

Прямые лицензии. Доступ к корпусу данных по модели франшизы: фиксированная плата + роялти.

Риск: неопределенность авторских прав.

Пример №1: соглашения медиа с ИИ-разработчиками (The New York Times vs OpenAI).

Пример №2: соглашения форум-платформ с ИИ-разработчиками (Stack Overflow, Quora – OpenAI, Google).

Подписка на API или токены. Оплата за каждый запрос или цитирование. Удобнее, чем продажа «по гигабайтам».

Риск: рост расходов на инфраструктуру.

Пример №1: Neon платит пользователям до 30 центов за каждую минуту записанного ими диалога с другим человеком через мобильный телефон. Полученные данные перепродают другим компаниям для обучения моделей искусственного интеллекта. Пользователь может зарабатывать до $30 в день.

Пример №2: консорциум Dataset Providers Alliance лицензирует данные по модели opt-in, продавая доступ к данным исключительно с согласия правообладателя, повышая прозрачность соглашения между его участниками.

Data marketplaces. Маркетплейсы специализированных дата-сетов с подпиской. Дают возможность получить готовые наборы данных под конкретную индустрию: ритейл, телеком, медиа.

Риск: законность использования и сложность оценки ценности данных.

Пример: аналитическая платформа Datawiz BES предоставляет доступ к дата-сетам, релевантным для телекома и ритейла, а также инструментам для их анализа.

Clean rooms / Fine-tuning as a service. Вместо передачи данных внешнему поставщику вычислительная среда с ШИ-моделью разворачивается непосредственно в месте их хранения – на стороне клиента или в контролируемой инфраструктуре. Это позволяет обучать модели в безопасной среде с соблюдением юридических и комплаенс-требований.

Риск: утечки данных при выводе, которые могут быть использованы для атак типа membership inference или model inversion.

Пример: LiveRamp предлагает изолированные среды (Safe Haven), инструменты для совместного анализа данных, псевдонимизацию и другие решения, позволяющие клиентам безопасно взаимодействовать с данными без их полной передачи.

Роялти за результат (Output-linked royalties). Поставщик данных получает оплату только тогда, когда данные реально использованы в финальном ответе или выводе модели.

Риск: атрибуция – сложно точно определить, какие именно части данных повлияли на результат, особенно в больших моделях со многими источниками.

Пример: ИИ-платформа Perplexity предлагает модель, где издатели контента могут получать долю дохода, когда их материалы используются в результатах поисковых запросов на платформе.

Data unions / trusts. Отдельные пользователи или малый бизнес объединяют свои данные коллективно (в трасты) и предлагают их пакетом за вознаграждение, которое распределяется между участниками.

Риски:

  • управление: сложно обеспечить прозрачный учет взноса и справедливое распределение доходов;
  • регуляция: необходимость соблюдения законов о защите данных и контроле рисков повторной идентификации.

Пример №1: Swash – браузерное расширение, собирающее активность пользователя, объединяющее ее в Data Union и распределяющее доход от продажи агрегированных данных.

Пример №2: DIMO – платформа IoT / автомобильных данных: владельцы авто подключают устройство или приложение, дают согласие на сбор данных и получают вознаграждение; данные агрегируются и продаются третьим сторонам.

Корпоративный «замок на данных». Компания изолирует собственные first-party-данные и использует их в качестве основы для разработки и лицензирования продуктов.

Риск: высокая стоимость хранения, обработки и поддержки инфраструктуры.

Пример: Dow Jones / Factiva расширил маркетплейс ИИ-контента, предоставив более 5000 издательствам возможность лицензировать свой контент компаниям. Это пример закрытой модели работы с first-party-данными и их коммерческого использования.

Эволюция рынка на практике

Вышеприведенные модели не возникли на пустом месте. Рынок прошел фазу проб и ошибок: в США и Европе первые схемы обучения LLM-моделей строились в спешке, без четкой фиксации прав владельцев данных и ограничений для внешних пользователей. Много источников данных: медиа, фотографы, исследовательские организации не были юридически готовы защищать свои интересы. Технологические же компании действовали достаточно самоуверенно, используя любые доступные массивы, без оглядки на последствия.

Результатом стали громкие конфликты интересов и судебные процессы: от NYT против OpenAI до Getty против Stability AI. Эти кейсы показали: без прозрачных договоров и правил рынок неизбежно скатывается в споры.

Для Украины это сигнал: владельцам данных следует уже сейчас на уровне публичных оферт, лицензий и правил использования формировать юридические механизмы защиты. Чтобы завтра не пришлось догонять рынок через суды.

Впрочем, именно эти конфликты послужили толчком к взрослению индустрии. Под давлением исков и репутационных рисков технологические компании и владельцы данных начали выстраивать более зрелые подходы: появились прозрачные лицензии, подписка на API, дата-маркетплейсы с юридическими гарантиями, защищенные clean rooms для обучения моделей. Данные перестали восприниматься как бесплатное «топливо» и превратились в юридически оформленный актив, вокруг которого строятся устойчивые бизнес-экосистемы.

Для Украины это особенно важно: мы можем взять уже готовые практики, которые на Западе рождались в судах, и с самого начала встроить их в свои правила игры – от стандартов публичных договоров до форматов API-атрибуции и роялти.

Шанс для Украины

Для Украины открывается редкое окно возможностей. Пока США и Европа учились на своих ошибках и тратили миллионы в судах, мы можем стартовать с чистого листа.

У нас уже есть отрасли, сидящие на золотых жилах данных: энергетика, банки, телеком, медиа. Им достаточно не продавать «сырые байты», а оформить их в продукты:

  • machine-readable-лицензии в договорах;
  • объединение медиакомпаний в data unions;
  • защищенные clean rooms для обучения моделей;
  • справедливые схемы роялти и API атрибуции.

Такой подход превращает данные не в риск, а в капитал. Главный вопрос – успеем ли мы воспользоваться этим окном, пока оно открыто.

Практический чек-лист, что делать уже сейчас:

  • Медиа и авторы: провести инвентаризацию прав, выставить machine-readable-лицензии, определить стратегию – идти в суд или заключать соглашения с пользователями данных, в том числе технологическими компаниями.
  • Компании – покупатели ИИ: закладывать DPIA, требовать гарантии происхождения данных, резервировать бюджет на юридические расходы.
  • Провайдеры ИИ: публиковать data cards, выстраивать процессы реагирования на иски, запускать API для атрибуции и роялти.

Данные – это не байты и не строчки. Это новая нефть, даже больше – это язык переговоров и инструмент построения конкурентных стратегий.

У Украины есть и источники, и спрос, и уникальный шанс перепрыгнуть «детские болезни» рынка. Воспользуемся ли мы этим шансом или будем торговать «сырым сырьевым продуктом», когда мир давно платит за готовые решения?

Материалы по теме
Контрибьюторы сотрудничают с Forbes на внештатной основе. Их тексты отражают личную точку зрения. У вас другое мнение? Пишите нашей редакторе Татьяне Павлушенко – [email protected]

Вы нашли ошибку или неточность?

Оставьте отзыв для редакции. Мы учтем ваши замечания как можно скорее.

Предыдущий слайд
Следующий слайд
Четвертий випуск 2025 року вже у продажу

Замовляйте з безкоштовною доставкою по Україні