Категорія
Новини
Дата

Meta запускає інструменти для редагування відео та фото на основі штучного інтелекту

1 хв читання

Компанія Meta Platforms запустила дві нові функції на основі штучного інтелекту для редагування відео та зображень, які можна використовувати для публікації в Instagram або Facebook, йдеться в релізі.

Amazon інвестує мільярди доларів у ШІ, роботів та машинне навчання. Якими принципами й правилами керується компанія?

Дізнайтеся вже 22 листопада на Forbes Tech 2024. Купуйте квиток за посиланням!

Ключові факти

  • Компанія оголосила про нові можливості редагування зображень, заснованого виключно на текстових інструкціях і методі перетворення тексту у відео на основі моделей дифузії.
  • Перший інструмент називається Emu Video, він перетворює текст у відеоролики з більш високою роздільною здатністю.
  • Інший Emu Edit дозволяє користувачам легко змінювати або редагувати відео за допомогою текстових підказок.
  • Emu Edit здатний виконувати редагування у вільній формі за допомогою інструкцій, що охоплюють такі завдання, як локальне та глобальне редагування, видалення та додавання фону, перетворення кольору та геометрії, виявлення та сегментація та багато іншого. 
  • Нові інструменти є розвитком моделі Emu, яка генерує зображення у відповідь текстові підказки.
  • Emu лежить в основі технології генеративного штучного інтелекту та деяких інструментів редагування зображень штучного інтелекту для Instagram, які дозволяють зробити фотографію та змінити її візуальний стиль чи тло.
  • За даними Reuters, Meta досягла швидких успіхів у всесвіті штучного інтелекту, який став одним з найбільш важливих напрямів її діяльності. Компанія прагне конкурувати з іншими гігантами, такими як Microsoft, Google та Amazon.

Контекст

У лютому Meta представила мовну модель LLaMA (Large Language Model Meta AI), розроблену, щоб допомогти дослідникам працювати в галузі ШІ. Мовна модель була доступна за некомерційною ліцензією для дослідників і організацій, повʼязаних із урядом, громадянським суспільством і науковими колами.

LLaMA працювала, приймаючи послідовність слів як вхідні дані та прогнозуючи наступне слово для рекурсивного генерування тексту. Щоб навчити модель, розробники використовували контент на 20 найпоширеніших мовах, зосередившись на мовах із латиницею та кирилицею.

У березні гендиректор компанії Марк Цукерберг заявив, що «розвиток ШІ й додання його у кожен наш продукт» – найбільша інвестиція компанії. Він сподівається розширити технологію й у метавсесвіт.

Матеріали по темі

Ви знайшли помилку чи неточність?

Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.

Попередній слайд
Наступний слайд