Мінцифри з компанією «Київстар» розпочали створення української великої мовної моделі (LLM), яка навчатиметься на унікальному наборі даних, щоб краще адаптуватися до українського контексту, повідомила пресслужба відомства.
Форум Підприємців 2025 у Києві. 26–27 червня – два дні практичного контенту, стратегій і нетворкінгу для бізнесу, що зростає. Долучайтеся за посиланням.
Деталі
- Мінцифри 17 червня уклало меморандум із «Київстар», який стане стратегічним партнером та інвестором розробки національної LLM. «Київстар» буде займатися розробкою, будувати експертизу і навчати цю модель», – сказав міністр цифрової трансформації Михайло Федоров під час презентації проєкту. За його словами, після створення LLM вона буде доступна за опенсорс-моделлю.
- До стратегічного комітету, який займатиметься розвитком цього проєкту, увійдуть Мінцифри, «Київстар» та інші партнери, сказав Федоров. «Будемо долучати університети та ІТ-компанії», – додав він.
- «Проєкт з розробки національної LLM розрахований на дев’ять місяців», – додав міністр. Після цього буде період бета-тестування моделі, який триватиме до 12 місяців, каже заступник міністра цифрової трансформації Олександр Борняков. «У цей період модель буде безкоштовною для державних установ, вишів та інших організацій», – додав заступник голови Мінцифри.
- Першу версію моделі планують презентувати до кінця 2025 року, зробивши її доступною для державних установ, університетів, науковців, громадських організацій і бізнесу. Для розробки знадобиться команда з 10–15 технічних спеціалістів та 30–40 лінгвістів, сказав директор з розробки цифрових продуктів «Київстар» Михайло Нестор під час презентації проєкту.
- «Реалізація подібного проєкту в Казахстані коштувала Veon $1,5–2 млн. В Україні ми орієнтуємося на таку ж суму», – додав Нестор.
- За словами Федорова, національна LLM стане основою для нових продуктів на базі штучного інтелекту, сприятиме розвитку стартапів, залученню інвестицій та економічному зростанню України. Він додав, що національна мовна модель краще враховуватиме українську мову, історію та контекст порівняно з іноземними аналогами. «Вона буде доступнішою, дешевшою та безпечнішою, адже дані зберігатимуться в Україні», – додав Федоров.
- За словами Борнякова, в період бета-тестування національну LLM можуть підключити до ШІ-асистента на порталі «Дія». «Подивитись, як воно працює», – додав він.
Контекст
Великі мовні моделі (LLM) – це системи штучного інтелекту, які використовують нейронні мережі для обробки, аналізу та генерації тексту. Вони тренуються на величезних масивах даних, що дозволяє їм розуміти мову, контекст і стиль, а також створювати логічні тексти. Засновані на архітектурі трансформерів, LLM передбачають послідовності слів, генеруючи відповіді, код чи статті. Їх застосовують у чатботах, перекладах, аналізі текстів і програмуванні. Приклади: GPT-4 (OpenAI), Gemini (Google), Llama (Meta).
У березні 2025 року міністр цифрової трансформації Михайло Федоров анонсував запуск першої україномовної LLM до кінця 2025 року. Це відкриє можливості для створення тисяч українських ШІ-продуктів, як-от віртуальні помічники (аналог ChatGPT), генератори тексту (Notion AI) чи інструменти програмування (GitHub Copilot).
Власна модель посилить безпеку, адже іноземні LLM можуть не враховувати український контекст і бути вразливими до пропаганди. Локальна обробка даних стане ключовою для ШІ в обороні, уряді, медицині та фінансах. Детальніше про це читайте у матеріалі Forbes Ukraine.
Ви знайшли помилку чи неточність?
Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.