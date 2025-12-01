Міністерство цифрової трансформації України разом із Київстар обрали велику мовну модель Gemma 3 від Google як основу для створення національної української LLM. Про це повідомило Мінцифри 1 грудня.

Деталі

На базі відкритої моделі Gemma 3 планується провести донавчання на унікальних україномовних даних, які зараз збирають експерти. Основна мета – максимально адаптувати модель до української мови та мінімізувати лінгвістичні й етичні ризики.

Ключові плановані кроки: вдосконалення українського токенайзера для зменшення помилок і оптимізації обчислень; донавчання на великих обсягах якісних україномовних текстів; створення спеціалізованих бенчмарків для оцінки та тонкого налаштування моделі.

Gemma 3 підтримує понад 140 мов (включно з українською), має контекстне вікно до 128 000 токенів, мультимодальні можливості (текст + зображення) та кілька розмірностей, що дозволяє обирати оптимальний варіант залежно від завдання.

При виборі враховували якість попередньої обробки української мови та рівень контрольованості моделі під час донавчання, повідоив Chief AI Officer Мінцифри та CEO WINWIN AI Center of Excellence Данило Цьвок.

Gemma забезпечує найкраще співвідношення продуктивності та необхідних ресурсів серед відкритих моделей, заявив директор з розробки диджитал-продуктів «Київстар» Михайло Нестор.

Gemma вже стала базою для найуспішніших українських LLM – MamayLM та Lapa LLM, а також для болгарської INSAIT BgGPT.

Представник Google Cloud Кшиштоф Казьов зазначив, що компанія продовжуватиме підтримувати проєкт створення національної української великої мовної моделі.

Контекст

На початку серпня 2025 року Мінцифри оголосило про створення національної AI Factory – інфраструктури для розробки та тренування державних ШІ-моделей. До її складу увійдуть потужні GPU-кластери, дата-центри, спеціалізоване ПЗ та команда спеціалістів, які займатимуться державними ШІ-продуктами.

Переможцем тендеру на будівництво першого етапу AI Factory став IT-інтегратор Lantec. За контрактом вартістю $5,4 млн компанія до червня 2026 року має поставити та запустити центр обробки даних на базі рішень Nvidia.

Саме на цій інфраструктурі працюватимуть два ключові державні ШІ-продукти: ассистент у застосунку «Дія» та ШІ-тьютор освітньої платформи «Мрія».