Категория: Инновации
Дата: 28 января 17:25

Черный лебедь на рынке ИИ. Можно ли доверять китайскому DeepSeek R1 ваши данные? Рассказывает эксперт по юридическим технологиям Петр Билык

Петр Билык

Контрибьютор Forbes

7 хв читання

Китайский ИИ-стартап DeepSeek стал настоящим черным лебедем на рынке искусственного интеллекта, стремительно взлетев к вершинам технологического олимпа, вызвав шок в Кремниевой долине и обрушив фондовые рынки. Его революционная ИИ-модель DeepSeek R1 поставила под сомнение лидерство США в сфере передовых технологий, повлекла за собой падение индекса Nasdaq и подорвала доверие к технологическим гигантам. Безопасно ли доверять свои данные DeepSeek и как эта ИИ-модель обрабатывает данные своих пользователей? Рассказывает Петр Билык, руководитель практик технологий и инвестиций, искусственного интеллекта в Juscutum.

DeepSeek R1 – ИИ-модель с ограниченным бюджетом в $6 млн. При отсутствии доступа к передовым американским чипам DeepSeek R1 уже создала конкуренцию другим моделям искусственного интеллекта в независимых тестах, а ее успех на Apple Store подтвердил заинтересованность пользователей.

Ее разработчик – стартап DeepSeek – использовал инновации, рожденные в кризисе, и разработал модель, которая при ограниченных ресурсах может конкурировать с лучшими ИИ-ботами в мире. Это вызов самим принципам современного технологического лидерства.

Популярне

Категория: Компании
Дата: 21 августа

«Одна из самых крупных американских инвестиций в Украине». Россияне ударили по заводу Flex в Мукачево. Каковы последствия атаки

Однако.

DeepSeek: что это такое

DeepSeek – это китайская система искусственного интеллекта, предлагающая широкий набор функций, построенных на основе мощных языковых моделей.

Она позволяет пользователям:

общаться с чат-ботом, который может генерировать текст или работать с мультимедийными данными;
использовать API и SDK, позволяющие разработчикам интегрировать эти модели в собственные проекты;
и со вчерашнего дня генерировать изображение.

Благодаря универсальности и доступности DeepSeek привлекает инновационные стартапы и крупные компании, стремящиеся использовать гибкие AI-решения для повышения своей конкурентоспособности.

Аспекты безопасности и конфиденциальности DeepSeek

Использование данных для обучения моделей

DeepSeek собирает и разрабатывает внесенные пользователем тексты, загруженные файлы, историю чата и другую информацию, чтобы «совершенствовать и развивать» свои технологии искусственного интеллекта, говорится в Terms of Use и Privacy Policy модели.

В Terms of Use указано:

«4.3. …Мы можем минимально использовать Inputs (входные данные) и Outputs (выходные данные) для поддержки, обслуживания, разработки или улучшения сервиса либо технологий, лежащих в его основе».

Это значит, что DeepSeek анализирует и накапливает анонимизированные или частично обезличенные фрагменты запросов и ответов, чтобы точнее настраивать модели.

Подобный подход у большинства генеративных AI-платформ. Но это важный пункт, если вы предоставляете конфиденциальные данные через сервис.

Во многих случаях фраза «разработать или усовершенствовать… базовые технологии» фактически может означать использование пользовательских данных для обучения модели, тонкой настройки или других итерационных улучшений производительности.

В то же время Privacy Policy в разделе How we use your Information отмечено:

«Мы используем вашу информацию, чтобы… просматривать, улучшать и развивать сервис, в том числе путем… анализа, как люди его используют, а также путем обучения и совершенствования наших технологий».

Следовательно, данные, вводимые пользователями, и связанное содержимое может использоваться для обучения или усовершенствования моделей DeepSeek.

В других разделах User Input указано, что текст, аудиоввод, загруженные файлы и другое содержимое собираются, хранятся и обрабатываются DeepSeek. Это подтверждает, что DeepSeek действительно использует данные чатов пользователей для усовершенствования системы и обучения модели.

Сроки хранения данных

Их нет. В разделе How long do we keep your information Privacy Policy упоминается, что DeepSeek сохраняет информацию столько времени, сколько необходимо для целей улучшения, усовершенствования и развития системы.

Если пользователь не требует удалить данные, «разговоры» могут оставаться в системах DeepSeek.

Международная передача данных и хранение

В политике использования модели упоминается, что пользователи имеют определенные права на персональные данные, в зависимости от законодательства страны, в которой они проживают. Но отмечается, что личная информация пользователя хранится на серверах в Китае.

Передача данных третьим лицам

DeepSeek может делиться информацией, собранной при использовании системы, в случаях:

со сторонними провайдерами (Service Providers);
с рекламными или аналитическими партнерами;
с компаниями в рамках корпоративной группы компаний;
с государственными органами в рамках законодательства.

Политика обезличивания и шифрования

В своих Terms of Use DeepSeek обещает secure encryption technology и strict de-identification. То есть компания шифрует пользовательские сессии и данные, отсылаемые на сервер; применяет механизмы обезличивания (где возможно) для сокращения риска идентификации конкретного лица.

Хотя в правовом поле любая политика анонимизации не является стопроцентной гарантией, DeepSeek декларирует соблюдение определенных требований в области защиты данных и общемировых стандартов безопасности. Однако это не отменяет того факта, что содержимое, вводимое пользователем, может обрабатываться для совершенствования модели.

Возможность управления и удаления данных

DeepSeek предоставляет пользователям определенные инструменты управления информацией, согласно Privacy Policy:

в настройках аккаунта можно очищать историю чатов;
возможность деактивировать аккаунт.

По умолчанию, система может использовать данные, если пользователь не подает запрос на их удаление.

Несмотря на то, что вы можете иметь определенные права на доступ или удаление вашей личной информации, право на отрицание или ограничение определенной обработки, некоторые данные все еще могут сохраняться для соответствия или «законных бизнес-интересов», таких как улучшение сервиса или для выполнения юридических и нормативных требований.

Примечательно, что DeepSeek не дает возможности «отказаться» от использования данных ваших чатов для «обучения и усовершенствования технологии», как, например, в OpenAI.

Если приоритет – полное удаление персональных данных, нужно будет обращаться к DeepSeek с дополнительным запросом.

Политики западных конкурентов

Давайте сравним DeepSeek с другими моделями.

ChatGPT от OpenAI

Американский ИИ-стартап OpenAI имеет отдельную политику для пользователей европейской экономической зоны.

Хотя OpenAI использует данные пользователей для тренировки моделей, в частности собранные через ChatGPT, в Privacy Policy и специальном Notice on model training описана возможность отказаться (opt out) от использования внесенной информации для обучения. Такие настройки доступны в каждой учетной записи.

Компания предлагает отдельные инструкции (в частности, для корпоративных пользователей ChatGPT Enterprise), как запретить доступ к истории чатов или отключить ее сохранение.

Предусматривает стандартные права (доступ, исправление, удаление, перенос, ограничение обработки) и дополнительно описывает возможность отключить сохранение чата, после чего сообщения удаляются из основных систем OpenAI через 30 дней. Указаны контактные каналы и подробные инструкции по подаче запросов.

Имеет специальный раздел Data transfers, где подробно описывает, как происходит обработка данных пользователей из ЕС, Великобритании, Швейцарии, и разъясняет, что OpenAI использует стандартные договорные клаузулы, инструменты соответствия, а также механизмы adequacy (при наличии).

Claude от Anthropic

По условиям актуальной Privacy Policy, Claude от американского единорога Anthropic не использует разговоры пользователей для тренировки моделей в большинстве случаев.

Исключения, если контент:

был отправлен как обратная связь (Feedback);
отмечен для Trust & Safety-проверок;
пользователь добровольно согласился.

Модель Anthropic в целом более сдержанно привлекает пользовательские Inputs/Outputs к учебному процессу.

Flagged Inputs и Outputs могут быть использованы для тренировки специальных моделей без привязки к конкретному пользователю.

Claude предлагает набор стандартных прав (доступ, исправление, удаление, отрицание). Большое упор делается на Right to Know и Right to Delete с уточнением – после удаления разговоров из чат-истории компания стирает их со своих бэкенд-систем в течение 30 дней. Условия приближаются к GDPR-подходу с пошаговым объяснением, как запросить и в какие сроки он будет выполнен.

Имеет подробно прописанную секцию о Data Transfers, где упомянут reliance на adequacy decisions (решение о надлежащем уровне защиты), стандартные договорные клаузулы и другие юридические инструменты для передачи данных из ЕС/Великобритании в США.

Anthropic – компания с офисом в США и дочерней фирмой в Ирландии. С этим связано соблюдение правил GDPR и других местных норм.

Рекомендации для компаний и частных лиц

Политика внутреннего использования

Если организация планирует интегрировать DeepSeek для сотрудников, пропишите четкие правила ввода конфиденциальных данных. Возможно, следует избегать загрузки документов с закрытой информацией или использовать специальные механизмы дополнительной анонимизации.

В Украине за основу взят законопроект №8153 от 25 октября 2022 года об изменении законодательства о персональных данных и приведении его в соответствие с европейским GDPR. Следите за ходом его принятия.

Оценка рисков

Проведите анализ соответствия политик DeepSeek с локальным законодательством о защите данных, особенно если вы действуете в ЕС GDPR) или других регионах со своим регулированием.

Если вы работаете в ЕС, с февраля 2025-го частично заработает АІ Акт, что также потребует от компаний осуществлять оценку рисков. К тому же принята международная Рамочная конвенция об искусственном интеллекте, которую Украина также планирует ратифицировать.

Для того чтобы понять риски, можно использовать методологию HUDERIA, которую 28 ноября 2024 года утвердил Совет Европы.

Запретите передавать конфиденциальную информацию

Запретите команде вводить в чат подробности бизнес-соглашений, персональные данные или чувствительную конфиденциальную информацию.

Соблюдайте законодательство о трансграничной передаче данных

DeepSeek хранит данные на серверах Китая и подчиняется юрисдикции КНР. КНР не является надежной юрисдикцией для целей GDPR.

Международные компании, планирующие интегрировать DeepSeek, должны учитывать правила трансграничной передачи данных, например согласно GDPR, standart contract clauses.

Контрольные запросы об удалении

Если вам стало известно, что сотрудник нарушил требования и передал конфиденциальную информацию, немедленно обратитесь в DeepSeek. Адреса и контактные каналы приведены в разделе Contact us в Terms of Use и Privacy Policy.

Регулярный аудит и обновление

DeepSeek постоянно обновляет свои Terms of Use и Privacy Policy. Отслеживайте, как меняются условия использования и переработки данных.

DeepSeek предлагает генеративный ИИ, но его политика позволяет шире использовать данные пользователей для обучения моделей, в отличие от OpenAI и Anthropic, подробно регулирующих процедуры отказа и удаления информации.

Выбор ИИ-платформы зависит от приоритетов функциональности и защиты данных. Перед использованием оцените политики пользования, риски и обеспечьте конфиденциальность своих данных для конкурентных преимуществ.

Материалы по теме

Категория: Инновации
Дата: 27 января

DeepSeek R1 бросает вызов чатам GPT и Llama. Как экспортные ограничения США спровоцировали рождение в Китае соперника западным ИИ-гигантам? Разбор WIRED

Категория: Инновации
Дата: 17 июля 2023

Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes

Категория: Инновации
Дата: 04 сентября 2023

«Красные» команды против ИИ-гидры. Для чего Google, Meta и OpenAI нанимают хакеров взламывать свои же чаты на основе искусственного интеллекта

Контрибьюторы сотрудничают с Forbes на внештатной основе. Их тексты отражают личную точку зрения. У вас другое мнение? Пишите нашей редакторе Татьяне Павлушенко – [email protected]

Вы нашли ошибку или неточность?

Оставьте отзыв для редакции. Мы учтем ваши замечания как можно скорее.