Пользователи ИИ-бота Gemini от Google теперь могут создавать и делиться видео, используя видеомодель Veo 2, говорится в блоге компании. Генератор преобразует текстовые подсказки в динамические 8-секундные видеоролики.
Подарунок для справжніх лідерок та лідерів
Сертифікат Forbes — 365 днів доступу до якісної аналітики, інсайтів та історій успіху, що змінюють мислення. Купуйте зараз
Ключевые факты
- Новая функция ИИ создает 8-секундное видео с разрешением 720p, которое передается как файл MP4 в альбомном формате 16:9.
- Gemini поддерживает только генерацию текста в видео, но компания работает над расширением функционала в будущих обновлениях.
- Все видео, созданные с помощью Veo 2, обозначены SynthID – цифровым водяным знаком, встроенным в каждый кадр, указывающий на то, что видео создано с помощью ИИ.
- Генерировать видео могут пользователи Gemini Advanced в возрасте от 18 лет на всех языках и во всех странах, где доступны Gemini.
- «Veo 2 является значительным шагом вперед в создании видео с помощью ИИ, разработана для создания высококачественных, детализированных видео с кинематографическим реализмом», – сообщает Google.
- Благодаря лучшему пониманию физики реального мира и движений человека генератор обеспечивает плавное движение персонажей, реалистичные сцены и более тонкие визуальные детали в различных предметах и стилях.
- Для того чтобы сгенерировать видео, следует выбрать «Veo 2» из меню моделей в левом верхнем углу Gemini Advanced.
- Создавать и делиться видео можно и в мобильном приложении Gemini. Veo 2 также доступна в Google Labs через инструмент Whisk, позволяющий создавать новые изображения, используя как текстовые, так и графические подсказки, а теперь анимировать их в видео.
Контекст
Gemini – это ответ Google компаниям Microsoft Corp. и OpenAI, которые, по мнению некоторых экспертов, скорее воспользовались преимуществами нынешнего бума искусственного интеллекта, в частности среди облачных клиентов и разработчиков. Теперь Google стремится завлечь этих пользователей в свою экосистему с помощью более мощных инструментов.
Google представил Gemini в декабре 2023-го, модель обошла GPT-4 в большинстве тестов, демонстрируя мощность в анализе научных текстов, видео и юридических документов. Но праздник длился недолго – сразу начались попытки масштабировать функциональность: длинную память, генерацию подкастов, обработку PDF. Команда начала интегрировать Gemini во все продукты компании. ChatGPT и далее опережал Gemini по количеству загрузок: 600 млн против 140 млн, по данным Sensor Tower.
Подробнее о том, как создавался конкурент чата GPT – читайте здесь.

Вы нашли ошибку или неточность?
Оставьте отзыв для редакции. Мы учтем ваши замечания как можно скорее.