Meta Platforms Inc. делает свою большую языковую модель искусственного интеллекта Llama 2 доступной для коммерческого использования благодаря партнерству с большими облачными провайдерами, включая Microsoft Corp, пишет Bloomberg.
Отримуйте щоденний лист з останніми матеріалами та новинами від Forbes
Ключевые факты
- Компания заявила, что не берет плату за доступ или использование разработанной ею модели. В то же время, открывая технологию для других компаний, Meta добавила, что выигрывает от улучшений, которые могут быть сделаны, когда больше разработчиков будут использовать ее, проводить стресс-тестирование и выявлять проблемы с ней.
- Повышение доступности большой языковой модели, или LLM, также ставит Meta в один ряд с другими технологическими гигантами в гонке ИИ.
- Meta взяла на себя расходы по обучению моделей, а облачные поставщики, включая Microsoft, Amazon.com Inc. и Hugging Face, размещают инструменты и обеспечивают вычислительную мощность для их запуска.
- Коммерческое развертывание Llama 2 – это первый проект, дебютировавший группой генеративного ИИ компании, новой командой, созданной в феврале.
- Партнерство уже связывает Meta с Microsoft, которая стала явным лидером в области ИИ благодаря инвестициям и технологическому партнерству с создателем ChatGPT OpenAI, которая взимает плату за доступ к своей модели.
- Llama 2 с открытым исходным кодом может предоставить малым и средним предприятиям возможность быстрее тестировать и использовать LLM, не обладая серверами и вычислительными мощностями для размещения своей собственной модели.
- Большие языковые модели, или LLM, обеспечивают работу текстовых чат-ботов, хотя их использование не ограничивается посредством ИИ в ответах на вопросы. Модели учатся, получая огромное количество информации, как правило, из интернета, чтобы усовершенствовать процесс создания ответов.
Контекст
В феврале Meta представила языковую модель LLaMA (Large Language Model Meta AI), разработанную, чтобы помочь исследователям работать в области искусственного интеллекта. Языковая модель была доступна по некоммерческой лицензии для исследователей и организаций, связанных с правительством, гражданским обществом и научными кругами.
LLaMA работала, принимая последовательность слов в качестве входных данных и прогнозируя следующее слово для рекурсивного генерирования текста. Чтобы обучить модель, разработчики использовали контент на 20 наиболее распространенных языках, сосредоточившись на языках с латиницей и кириллицей.

Вы нашли ошибку или неточность?
Оставьте отзыв для редакции. Мы учтем ваши замечания как можно скорее.