Категорія: Новини
Дата: 07 квітня 13:33

Навчання з підкріпленням. DeepSeek розробляє ШІ-моделі, здатні до самовдосконалення

Юрій Тарасовський

Forbes

1 хв читання

Китайський стартап у сфері штучного інтелекту DeepSeek, заснований мільярдером Лянем Веньфеном, працює над зменшенням витрат на навчання штучного інтелекту. Мета – зробити ШІ ефективнішим і дешевшим у використанні, пише Bloomberg.

Деталі

Стартап DeepSeek, який у січні здивував ринки своєю ШІ-моделлю, об’єднав зусилля з науковцями з Пекінського університету Цінхуа для оптимізації ШІ.
У спільній статті вони описали новий метод навчання з підкріпленням – ШІ зможе самостійно закріплювати набуті знання. Цей метод допомагає штучному інтелекту краще відповідати людським очікуванням, наділяючи моделі більш точними та зрозумілими відповідями.
За словами дослідників, новий метод показав кращі результати порівняно з існуючими, використовуючи менше комп’ютерних ресурсів. Моделі, які отримали назву DeepSeek-GRM (generalist reward modeling), планують відкрити для всіх бажаючих.

Популярне

Категорія: Рейтинги
Дата: 26 листопада

25 найкращих CEO України 2025

Контекст

DeepSeek не єдиний має амбіції у покращенні ШІ. Інші гравці ринку, зокрема, китайський гігант Alibaba та американська OpenAI, також працюють над покращенням здібностей штучного інтелекту до міркувань і самонавчання в реальному часі.

Meta Platforms нещодавно представила свою нову лінійку моделей Llama 4, що базується на архітектурі Mixture of Experts (MoE). DeepSeek також активно використовує MoE для економії ресурсів, а Meta порівнювала свої новинки саме з розробками китайського стартапу.

Матеріали по темі