Міністерство цифрової трансформації України разом із Київстар обрали велику мовну модель Gemma 3 від Google як основу для створення національної української LLM. Про це повідомило Мінцифри 1 грудня.
Купуйте річну передплату на шість журналів Forbes Ukraine за ціною чотирьох номерів. Якщо ви цінуєте якість, глибину та силу реального досвіду, ця передплата саме для вас.
Деталі
- На базі відкритої моделі Gemma 3 планується провести донавчання на унікальних україномовних даних, які зараз збирають експерти. Основна мета – максимально адаптувати модель до української мови та мінімізувати лінгвістичні й етичні ризики.
- Ключові плановані кроки: вдосконалення українського токенайзера для зменшення помилок і оптимізації обчислень; донавчання на великих обсягах якісних україномовних текстів; створення спеціалізованих бенчмарків для оцінки та тонкого налаштування моделі.
- Gemma 3 підтримує понад 140 мов (включно з українською), має контекстне вікно до 128 000 токенів, мультимодальні можливості (текст + зображення) та кілька розмірностей, що дозволяє обирати оптимальний варіант залежно від завдання.
- При виборі враховували якість попередньої обробки української мови та рівень контрольованості моделі під час донавчання, повідоив Chief AI Officer Мінцифри та CEO WINWIN AI Center of Excellence Данило Цьвок.
- Gemma забезпечує найкраще співвідношення продуктивності та необхідних ресурсів серед відкритих моделей, заявив директор з розробки диджитал-продуктів «Київстар» Михайло Нестор.
- Gemma вже стала базою для найуспішніших українських LLM – MamayLM та Lapa LLM, а також для болгарської INSAIT BgGPT.
- Представник Google Cloud Кшиштоф Казьов зазначив, що компанія продовжуватиме підтримувати проєкт створення національної української великої мовної моделі.
- Категорія
- Рейтинги
- Дата
Контекст
На початку серпня 2025 року Мінцифри оголосило про створення національної AI Factory – інфраструктури для розробки та тренування державних ШІ-моделей. До її складу увійдуть потужні GPU-кластери, дата-центри, спеціалізоване ПЗ та команда спеціалістів, які займатимуться державними ШІ-продуктами.
Переможцем тендеру на будівництво першого етапу AI Factory став IT-інтегратор Lantec. За контрактом вартістю $5,4 млн компанія до червня 2026 року має поставити та запустити центр обробки даних на базі рішень Nvidia.
Саме на цій інфраструктурі працюватимуть два ключові державні ШІ-продукти: ассистент у застосунку «Дія» та ШІ-тьютор освітньої платформи «Мрія».
Ви знайшли помилку чи неточність?
Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.