Китайская компания DeepSeek перенесла релиз модели R2 после неудачной попытки научить ее на чипах Huawei Ascend. Это демонстрирует ограниченность возможностей Китая в попытках найти альтернативу американским технологиям, пишет FT .

Подробности

После выпуска модели R1 в январе власти Китая поощряли DeepSeek использовать Huawei Ascend вместо Nvidia. Однако во время тренировки R2 на чипах Huawei возникли стабильные технические проблемы, из-за которых компания перешла на Nvidia для обучения и оставила Ascend только для инференса (работы готовой модели). Это стало главной причиной задержки запуска с мая и дало фору конкурентам, отметило издание.

Инженеры Huawei работали непосредственно в офисе DeepSeek, но даже с их помощью провести успешную тренировку модели на Ascend не удалось. Дополнительной причиной задержки стала продолжительная маркировка данных для обновленной версии.

Эксперты отмечают, что китайские чипы уступают Nvidia по стабильности, скорости соединения и качеству программного обеспечения.

В то же время, по словам исследователей, Huawei переживает «болезнь роста» и со временем может адаптироваться к полноценной тренировке больших моделей.

Борьба за экосистему ИИ в Китае обостряется, и преимущество может определить качество и удобство инструментов для разработчиков, отмечают эксперты.

Контекст

В конце июля администрация Трампа остановила введение новых ограничений на экспорт технологий в Китай.

Задержка DeepSeek происходит на фоне давления Пекина на национальные компании, чтобы те обосновывали закупки Nvidia H20 и переходили на Huawei и Cambricon.

Nvidia недавно договорилась возобновить продажу H20 в Китае, согласившись передавать часть доходов правительству США.