Китайський стартап у сфері штучного інтелекту DeepSeek, заснований мільярдером Лянем Веньфеном, працює над зменшенням витрат на навчання штучного інтелекту. Мета – зробити ШІ ефективнішим і дешевшим у використанні, пише Bloomberg.
Подарунок для справжніх лідерок та лідерів
Сертифікат Forbes — 365 днів доступу до якісної аналітики, інсайтів та історій успіху, що змінюють мислення. Купуйте зараз
Деталі
- Стартап DeepSeek, який у січні здивував ринки своєю ШІ-моделлю, об’єднав зусилля з науковцями з Пекінського університету Цінхуа для оптимізації ШІ.
- У спільній статті вони описали новий метод навчання з підкріпленням – ШІ зможе самостійно закріплювати набуті знання. Цей метод допомагає штучному інтелекту краще відповідати людським очікуванням, наділяючи моделі більш точними та зрозумілими відповідями.
- За словами дослідників, новий метод показав кращі результати порівняно з існуючими, використовуючи менше комп’ютерних ресурсів. Моделі, які отримали назву DeepSeek-GRM (generalist reward modeling), планують відкрити для всіх бажаючих.
Контекст
DeepSeek не єдиний має амбіції у покращенні ШІ. Інші гравці ринку, зокрема, китайський гігант Alibaba та американська OpenAI, також працюють над покращенням здібностей штучного інтелекту до міркувань і самонавчання в реальному часі.
Meta Platforms нещодавно представила свою нову лінійку моделей Llama 4, що базується на архітектурі Mixture of Experts (MoE). DeepSeek також активно використовує MoE для економії ресурсів, а Meta порівнювала свої новинки саме з розробками китайського стартапу.


Ви знайшли помилку чи неточність?
Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.