Meta Platforms запустила две новые функции на основе искусственного интеллекта для редактирования видео и изображений, которые можно использовать для публикации в Instagram или Facebook, говорится в релизе.
Amazon інвестує мільярди доларів у ШІ, роботів та машинне навчання. Якими принципами й правилами керується компанія?
Дізнайтеся вже 22 листопада на Forbes Tech 2024. Купуйте квиток за посиланням!
Ключевые факты
- Компания объявила о новых возможностях редактирования изображений, основанного исключительно на текстовых инструкциях и методе преобразования текста в видео на основе моделей диффузии.
- Первый инструмент называется Emu Video, он преобразовывает текст в видеоролики с более высоким разрешением.
- Другая Emu Edit позволяет пользователям легко изменять или редактировать видео с помощью текстовых подсказок.
- Emu Edit способен выполнять редактирование в свободной форме с помощью инструкций, охватывающих такие задачи, как локальное и глобальное редактирование, удаление и добавление фона, цветообразование и геометрия, обнаружение и сегментация и многое другое.
- Новые инструменты являются развитием модели Emu, которая генерирует изображения в ответ на текстовые подсказки.
- Emu лежит в основе технологии генеративного искусственного интеллекта и некоторых инструментов редактирования изображений искусственного интеллекта для Instagram, позволяющих сделать фотографию и изменить ее визуальный стиль или фон.
- По данным Reuters, Meta добилась быстрых успехов во вселенной искусственного интеллекта, который стал одним из наиболее важных направлений ее деятельности. Компания стремится конкурировать с другими гигантами, такими как Microsoft, Google и Amazon.
Контекст
В феврале Meta представила языковую модель LLaMA (Large Language Model Meta AI), разработанную, чтобы помочь исследователям работать в области ИИ. Языковая модель была доступна по некоммерческой лицензии для исследователей и организаций, связанных с правительством, гражданским обществом и научными кругами.
LLaMA работала, принимая последовательность слов в качестве входных данных и прогнозируя следующее слово для рекурсивного генерирования текста. Чтобы научить модель, разработчики использовали контент на 20 самых распространенных языках, сосредоточившись на языках с латиницей и кириллицей.
В марте гендиректор компании Марк Цукерберг заявил, что «развитие ИИ и добавление его в каждый наш продукт» – самая большая инвестиция компании. Он надеется расширить технологию и в метавселенную.
Вы нашли ошибку или неточность?
Оставьте отзыв для редакции. Мы учтем ваши замечания как можно скорее.