Google, що належить Alphabet Inc., додає функцію для платних користувачів Gemini AI, яка дозволяє створювати короткі відеокліпи з фотографій. Про це пише Bloomberg 10 липня.
Купуйте річну передплату на 6 журналів Forbes Ukraine зі змістовними матеріалами, рейтингами та аналітикою від 1 350 грн.
Деталі
- З четверга підписники планів Google AI Ultra та Pro в окремих регіонах зможуть використовувати функцію через вебверсію Gemini, а протягом тижня – у мобільному додатку. Користувачі можуть створювати 8-секундні відео зі звуком у форматі MP4 (720p, 16:9) на основі фото та текстового опису.
- Функція, інтегрована в чат-інтерфейс Gemini, допомагає Google конкурувати з OpenAI, Runway AI та китайськими компаніями, як-от Alibaba та Kuaishou.
- Вона працює на базі моделі Veo 3, представленої в травні. Google забороняє створювати відео з публічно відомими особами чи контент, що заохочує насильство.
- Під час тестування Bloomberg News виявив, що інструмент може змінювати риси обличчя чи расу суб’єктів. Прості завдання, як анімація рослин чи тварин, виконуються краще, ніж складні, наприклад, створення відео з брейкдансом.
- Google пояснює, що це нова технологія, яка краще анімує об’єкти чи природу, і планує її вдосконалювати.
Контекст
Google вперше представив модель генерації відео Veo у травні 2024 року на конференції Google I/O. Вона створювала відео у форматі 1080p тривалістю понад хвилину за текстовими запитами, забезпечуючи складні сцени, реалістичні рухи та кінематографічні ефекти.
У грудні 2024 року вийшла оновлена версія Veo 2, яка підтримувала роздільну здатність 4K і краще відтворювала фізичні рухи об’єктів, їхню поведінку та освітлення. У квітні 2025 року Veo 2 стала доступною для обмеженої аудиторії через додаток Gemini.
У травні Google анонсував Veo 3 – найсучаснішу модель, яка не лише генерує відео у 4K, а й синхронізує їх із музикою, голосом або звуковими ефектами. Veo 3 інтегрована в плани Gemini (Pro/Ultra) та Google Cloud Vertex AI. Для захисту від зловживань Google використовує технологію SynthID для прихованих цифрових водяних знаків, а також видимі мітки.
У червні CNBC повідомило, що Google використовував відео з YouTube для тренування моделей Veo та Gemini без явної згоди авторів і без можливості відмови. Хоча Google заявляє про відповідність умовам YouTube, критики вказують на проблеми з авторськими правами та прозорістю.



Ви знайшли помилку чи неточність?
Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.