Категория
Новости
Дата

Meta запускает инструменты для редактирования видео и фото на основе искусственного интеллекта

1 хв читання

Meta Platforms запустила две новые функции на основе искусственного интеллекта для редактирования видео и изображений, которые можно использовать для публикации в Instagram или Facebook, говорится в релизе.

Amazon інвестує мільярди доларів у ШІ, роботів та машинне навчання. Якими принципами й правилами керується компанія?

Дізнайтеся вже 22 листопада на Forbes Tech 2024. Купуйте квиток за посиланням!

Ключевые факты

  • Компания объявила о новых возможностях редактирования изображений, основанного исключительно на текстовых инструкциях и методе преобразования текста в видео на основе моделей диффузии.
  • Первый инструмент называется Emu Video, он преобразовывает текст в видеоролики с более высоким разрешением.
  • Другая Emu Edit позволяет пользователям легко изменять или редактировать видео с помощью текстовых подсказок.
  • Emu Edit способен выполнять редактирование в свободной форме с помощью инструкций, охватывающих такие задачи, как локальное и глобальное редактирование, удаление и добавление фона, цветообразование и геометрия, обнаружение и сегментация и многое другое.
  • Новые инструменты являются развитием модели Emu, которая генерирует изображения в ответ на текстовые подсказки.
  • Emu лежит в основе технологии генеративного искусственного интеллекта и некоторых инструментов редактирования изображений искусственного интеллекта для Instagram, позволяющих сделать фотографию и изменить ее визуальный стиль или фон.
  • По данным Reuters, Meta добилась быстрых успехов во вселенной искусственного интеллекта, который стал одним из наиболее важных направлений ее деятельности. Компания стремится конкурировать с другими гигантами, такими как Microsoft, Google и Amazon.

Контекст

В феврале Meta представила языковую модель LLaMA (Large Language Model Meta AI), разработанную, чтобы помочь исследователям работать в области ИИ. Языковая модель была доступна по некоммерческой лицензии для исследователей и организаций, связанных с правительством, гражданским обществом и научными кругами.

LLaMA работала, принимая последовательность слов в качестве входных данных и прогнозируя следующее слово для рекурсивного генерирования текста. Чтобы научить модель, разработчики использовали контент на 20 самых распространенных языках, сосредоточившись на языках с латиницей и кириллицей.

В марте гендиректор компании Марк Цукерберг заявил, что «развитие ИИ и добавление его в каждый наш продукт» – самая большая инвестиция компании. Он надеется расширить технологию и в метавселенную.

Материалы по теме

Вы нашли ошибку или неточность?

Оставьте отзыв для редакции. Мы учтем ваши замечания как можно скорее.

Предыдущий слайд
Следующий слайд