Категорія
Новини
Дата

Google представив функцію перетворення зображень на короткі відеокліпи за допомогою ШІ

1 хв читання

Google, що належить Alphabet Inc., додає функцію для платних користувачів Gemini AI, яка дозволяє створювати короткі відеокліпи з фотографій. Про це пише Bloomberg 10 липня. 

Купуйте річну передплату на 6 журналів Forbes Ukraine зі змістовними матеріалами, рейтингами та аналітикою від 1 350 грн.

Деталі 

  • З четверга підписники планів Google AI Ultra та Pro в окремих регіонах зможуть використовувати функцію через вебверсію Gemini, а протягом тижня – у мобільному додатку. Користувачі можуть створювати 8-секундні відео зі звуком у форматі MP4 (720p, 16:9) на основі фото та текстового опису.
  • Функція, інтегрована в чат-інтерфейс Gemini, допомагає Google конкурувати з OpenAI, Runway AI та китайськими компаніями, як-от Alibaba та Kuaishou. 
  • Вона працює на базі моделі Veo 3, представленої в травні. Google забороняє створювати відео з публічно відомими особами чи контент, що заохочує насильство.
  • Під час тестування Bloomberg News виявив, що інструмент може змінювати риси обличчя чи расу суб’єктів. Прості завдання, як анімація рослин чи тварин, виконуються краще, ніж складні, наприклад, створення відео з брейкдансом.
  • Google пояснює, що це нова технологія, яка краще анімує об’єкти чи природу, і планує її вдосконалювати.

Контекст 

Google вперше представив модель генерації відео Veo у травні 2024 року на конференції Google I/O. Вона створювала відео у форматі 1080p тривалістю понад хвилину за текстовими запитами, забезпечуючи складні сцени, реалістичні рухи та кінематографічні ефекти.

У грудні 2024 року вийшла оновлена версія Veo 2, яка підтримувала роздільну здатність 4K і краще відтворювала фізичні рухи об’єктів, їхню поведінку та освітлення. У квітні 2025 року Veo 2 стала доступною для обмеженої аудиторії через додаток Gemini.

У травні Google анонсував Veo 3 – найсучаснішу модель, яка не лише генерує відео у 4K, а й синхронізує їх із музикою, голосом або звуковими ефектами. Veo 3 інтегрована в плани Gemini (Pro/Ultra) та Google Cloud Vertex AI. Для захисту від зловживань Google використовує технологію SynthID для прихованих цифрових водяних знаків, а також видимі мітки.

У червні CNBC повідомило, що Google використовував відео з YouTube для тренування моделей Veo та Gemini без явної згоди авторів і без можливості відмови. Хоча Google заявляє про відповідність умовам YouTube, критики вказують на проблеми з авторськими правами та прозорістю.

Матеріали по темі

Ви знайшли помилку чи неточність?

Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.

Попередній слайд
Наступний слайд
Третій випуск 2025 року вже у продажу

Замовляйте з безкоштовною доставкою по Україні