Meta Platforms Inc. робить свою велику мовну модель штучного інтелекту Llama 2 доступною для комерційного використання завдяки партнерству з великими хмарними провайдерами, включаючи Microsoft Corp, пише Bloomberg.
Ключові факти
- Компанія заявила, що не стягує плати за доступ або використання розробленої нею моделі. Натомість, відкриваючи технологію іншим компаніям, Meta додала, що виграє від поліпшень, які можуть бути зроблені, коли більше розробників будуть використовувати її, проводити стрес-тестування та виявляти проблеми з нею.
- Підвищення доступності великої мовної моделі, або LLM, також ставить Meta поряд з іншими технологічними гігантами у гонці ШІ.
- Meta взяла на себе витрати на навчання моделей, а хмарні постачальники, включаючи Microsoft, Amazon.com Inc. та Hugging Face, розміщують інструменти та надають обчислювальну потужність для їхнього запуску.
- Комерційне розгортання Llama 2 – це перший проєкт, який дебютував групою генеративного ШІ компанії, новою командою, створеною в лютому.
- Партнерство тісніше повʼязує Meta з Microsoft, яка стала явним лідером в галузі ШІ завдяки інвестиціям та технологічному партнерству із творцем ChatGPT OpenAI, яка стягує плату за доступ до своєї моделі.
- Llama 2 з відкритим вихідним кодом може надати малим та середнім підприємствам можливість швидше тестувати та використовувати LLM, не володіючи серверами та обчислювальними потужностями для розміщення своєї власної моделі.
- Великі мовні моделі, або LLM, забезпечують роботу текстових чат-ботів, хоча їх використання не обмежується допомогою ШІ у відповідях на запитання. Моделі навчаються, отримуючи величезну кількість інформації, як правило, з інтернету, щоб удосконалити процес створення відповідей.
Контекст
У лютому Meta представила мовну модель LLaMA (Large Language Model Meta AI), розроблену, щоб допомогти дослідникам працювати в галузі штучного інтелекту. Мовна модель була доступна за некомерційною ліцензією для дослідників і організацій, повʼязаних із урядом, громадянським суспільством і науковими колами.
LLaMA працювала, приймаючи послідовність слів як вхідні дані та прогнозуючи наступне слово для рекурсивного генерування тексту. Щоб навчити модель, розробники використовували контент на 20 найпоширеніших мовах, зосередившись на мовах із латиницею та кирилицею.
Ви знайшли помилку чи неточність?
Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.