Категорія
Новини
Дата

Навчання з підкріпленням. DeepSeek розробляє ШІ-моделі, здатні до самовдосконалення

1 хв читання

Китайський стартап у сфері штучного інтелекту DeepSeek, заснований мільярдером Лянем Веньфеном, працює над зменшенням витрат на навчання штучного інтелекту. Мета – зробити ШІ ефективнішим і дешевшим у використанні, пише Bloomberg.

Подарунок для справжніх лідерок та лідерів

Сертифікат Forbes — 365 днів доступу до якісної аналітики, інсайтів та історій успіху, що змінюють мислення. Купуйте зараз

Деталі

  • Стартап DeepSeek, який у січні здивував ринки своєю ШІ-моделлю, об’єднав зусилля з науковцями з Пекінського університету Цінхуа для оптимізації ШІ.
  • У спільній статті вони описали новий метод навчання з підкріпленням – ШІ зможе самостійно закріплювати набуті знання. Цей метод допомагає штучному інтелекту краще відповідати людським очікуванням, наділяючи моделі більш точними та зрозумілими відповідями. 
  • За словами дослідників, новий метод показав кращі результати порівняно з існуючими, використовуючи менше комп’ютерних ресурсів. Моделі, які отримали назву DeepSeek-GRM (generalist reward modeling), планують відкрити для всіх бажаючих.

Контекст

DeepSeek не єдиний має амбіції у покращенні ШІ. Інші гравці ринку, зокрема, китайський гігант Alibaba та американська OpenAI, також працюють над покращенням здібностей штучного інтелекту до міркувань і самонавчання в реальному часі. 

Meta Platforms нещодавно представила свою нову лінійку моделей Llama 4, що базується на архітектурі Mixture of Experts (MoE). DeepSeek також активно використовує MoE для економії ресурсів, а Meta порівнювала свої новинки саме з розробками китайського стартапу. 

Матеріали по темі

Ви знайшли помилку чи неточність?

Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.

Попередній слайд
Наступний слайд
Другий випуск 2025 року вже у передпродажу

Замовляйте з безкоштовною доставкою по Україні