Китайская компания DeepSeek перенесла релиз модели R2 после неудачной попытки научить ее на чипах Huawei Ascend. Это демонстрирует ограниченность возможностей Китая в попытках найти альтернативу американским технологиям, пишет FT.
Покупайте годовую подписку на шесть журналов Forbes Ukraine по цене четырех. Если вы цените качество, глубину и силу реального опыта, эта подписка именно для вас.
Подробности
- После выпуска модели R1 в январе власти Китая поощряли DeepSeek использовать Huawei Ascend вместо Nvidia. Однако во время тренировки R2 на чипах Huawei возникли стабильные технические проблемы, из-за которых компания перешла на Nvidia для обучения и оставила Ascend только для инференса (работы готовой модели). Это стало главной причиной задержки запуска с мая и дало фору конкурентам, отметило издание.
- Инженеры Huawei работали непосредственно в офисе DeepSeek, но даже с их помощью провести успешную тренировку модели на Ascend не удалось. Дополнительной причиной задержки стала продолжительная маркировка данных для обновленной версии.
- Эксперты отмечают, что китайские чипы уступают Nvidia по стабильности, скорости соединения и качеству программного обеспечения.
- В то же время, по словам исследователей, Huawei переживает «болезнь роста» и со временем может адаптироваться к полноценной тренировке больших моделей.
- Борьба за экосистему ИИ в Китае обостряется, и преимущество может определить качество и удобство инструментов для разработчиков, отмечают эксперты.
Контекст
В конце июля администрация Трампа остановила введение новых ограничений на экспорт технологий в Китай.
Задержка DeepSeek происходит на фоне давления Пекина на национальные компании, чтобы те обосновывали закупки Nvidia H20 и переходили на Huawei и Cambricon.
Nvidia недавно договорилась возобновить продажу H20 в Китае, согласившись передавать часть доходов правительству США.
Вы нашли ошибку или неточность?
Оставьте отзыв для редакции. Мы учтем ваши замечания как можно скорее.