Категорія
Новини
Дата

Українську велику мовну модель тренуватиме ШІ від Google

1 хв читання

Міністерство цифрової трансформації України разом із Київстар обрали велику мовну модель Gemma 3 від Google як основу для створення національної української LLM. Про це повідомило Мінцифри 1 грудня.

Купуйте річну передплату на шість журналів Forbes Ukraine за ціною чотирьох номерів. Якщо ви цінуєте якість, глибину та силу реального досвіду, ця передплата саме для вас.

Деталі

  • На базі відкритої моделі Gemma 3 планується провести донавчання на унікальних україномовних даних, які зараз збирають експерти. Основна мета – максимально адаптувати модель до української мови та мінімізувати лінгвістичні й етичні ризики.
  • Ключові плановані кроки: вдосконалення українського токенайзера для зменшення помилок і оптимізації обчислень; донавчання на великих обсягах якісних україномовних текстів; створення спеціалізованих бенчмарків для оцінки та тонкого налаштування моделі.
  • Gemma 3 підтримує понад 140 мов (включно з українською), має контекстне вікно до 128 000 токенів, мультимодальні можливості (текст + зображення) та кілька розмірностей, що дозволяє обирати оптимальний варіант залежно від завдання.
  • При виборі враховували якість попередньої обробки української мови та рівень контрольованості моделі під час донавчання, повідоив Chief AI Officer Мінцифри та CEO WINWIN AI Center of Excellence Данило Цьвок.
  • Gemma забезпечує найкраще співвідношення продуктивності та необхідних ресурсів серед відкритих моделей, заявив директор з розробки диджитал-продуктів «Київстар» Михайло Нестор.
  • Gemma вже стала базою для найуспішніших українських LLM – MamayLM та Lapa LLM, а також для болгарської INSAIT BgGPT.
  • Представник Google Cloud Кшиштоф Казьов зазначив, що компанія продовжуватиме підтримувати проєкт створення національної української великої мовної моделі.

Контекст 

На початку серпня 2025 року Мінцифри оголосило про створення національної AI Factory – інфраструктури для розробки та тренування державних ШІ-моделей. До її складу увійдуть потужні GPU-кластери, дата-центри, спеціалізоване ПЗ та команда спеціалістів, які займатимуться державними ШІ-продуктами.

Переможцем тендеру на будівництво першого етапу AI Factory став IT-інтегратор Lantec. За контрактом вартістю $5,4 млн компанія до червня 2026 року має поставити та запустити центр обробки даних на базі рішень Nvidia.

Саме на цій інфраструктурі працюватимуть два ключові державні ШІ-продукти: ассистент у застосунку «Дія» та ШІ-тьютор освітньої платформи «Мрія».

Матеріали по темі

Ви знайшли помилку чи неточність?

Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.

Попередній слайд
Наступний слайд
П'ятий випуск 2025 року вже у продажу

Замовляйте з безкоштовною доставкою по Україні