Категория: Новости
Дата: 16 апреля 13:54

Google представил генератор коротких видео Veo 2 для пользователей Gemini

Анита Прасад

Forbes

1 хв читання

Пользователи ИИ-бота Gemini от Google теперь могут создавать и делиться видео, используя видеомодель Veo 2, говорится в блоге компании. Генератор преобразует текстовые подсказки в динамические 8-секундные видеоролики.

Ключевые факты

Новая функция ИИ создает 8-секундное видео с разрешением 720p, которое передается как файл MP4 в альбомном формате 16:9.
Gemini поддерживает только генерацию текста в видео, но компания работает над расширением функционала в будущих обновлениях.
Все видео, созданные с помощью Veo 2, обозначены SynthID – цифровым водяным знаком, встроенным в каждый кадр, указывающий на то, что видео создано с помощью ИИ.

Популярне

Категория: Деньги
Дата: 12 августа

Александр Писарук покинет Райффайзен Банк, узнал Forbes Ukraine. Как банк изменился за шесть лет во главе с ним?

Генерировать видео могут пользователи Gemini Advanced в возрасте от 18 лет на всех языках и во всех странах, где доступны Gemini.
«Veo 2 является значительным шагом вперед в создании видео с помощью ИИ, разработана для создания высококачественных, детализированных видео с кинематографическим реализмом», – сообщает Google.
Благодаря лучшему пониманию физики реального мира и движений человека генератор обеспечивает плавное движение персонажей, реалистичные сцены и более тонкие визуальные детали в различных предметах и стилях.
Для того чтобы сгенерировать видео, следует выбрать «Veo 2» из меню моделей в левом верхнем углу Gemini Advanced.
Создавать и делиться видео можно и в мобильном приложении Gemini. Veo 2 также доступна в Google Labs через инструмент Whisk, позволяющий создавать новые изображения, используя как текстовые, так и графические подсказки, а теперь анимировать их в видео.

Контекст

Gemini – это ответ Google компаниям Microsoft Corp. и OpenAI, которые, по мнению некоторых экспертов, скорее воспользовались преимуществами нынешнего бума искусственного интеллекта, в частности среди облачных клиентов и разработчиков. Теперь Google стремится завлечь этих пользователей в свою экосистему с помощью более мощных инструментов.

Google представил Gemini в декабре 2023-го, модель обошла GPT-4 в большинстве тестов, демонстрируя мощность в анализе научных текстов, видео и юридических документов. Но праздник длился недолго – сразу начались попытки масштабировать функциональность: длинную память, генерацию подкастов, обработку PDF. Команда начала интегрировать Gemini во все продукты компании. ChatGPT и далее опережал Gemini по количеству загрузок: 600 млн против 140 млн, по данным Sensor Tower.

Подробнее о том, как создавался конкурент чата GPT – читайте здесь.

Материалы по теме