Користувачі ШІ-бота Gemini від Google відтепер можуть створювати та ділитися відео, використовуючи відеомодель Veo 2, йдеться у блозі компанії. Генератор перетворює текстові підказки в динамічні 8-секундні відеоролики.
Подарунок для справжніх лідерок та лідерів
Сертифікат Forbes — 365 днів доступу до якісної аналітики, інсайтів та історій успіху, що змінюють мислення. Купуйте зараз
Ключові факти
- Нова функція ШІ створює 8-секундне відео з роздільною здатністю 720p, яке передається як файл MP4 в альбомному форматі 16:9.
- Наразі Gemini підтримує лише генерацію тексту у відео, але компанія працює над розширенням функціоналу у майбутніх оновленнях.
- Усі відео, створені за допомогою Veo 2, позначені SynthID – цифровим водяним знаком, вбудованим у кожен кадр, який вказує на те, що відео створено за допомогою ШІ.
- Генерувати відео можуть користувачі Gemini Advanced у віці від 18 років всіма мовами та в усіх країнах, де доступні програми Gemini.
- «Veo 2 є значним кроком уперед у створенні відео за допомогою ШІ, розроблений для створення високоякісних, деталізованих відео з кінематографічним реалізмом», – повідомляє Google.
- Завдяки кращому розумінню фізики реального світу та руху людини, генератор забезпечує плавний рух персонажів, реалістичні сцени й більш тонкі візуальні деталі у різних предметах і стилях.
- Для того щоб згенерувати відео, слід вибрати «Veo 2» з меню моделей у лівому верхньому куті Gemini Advanced.
- Створювати та ділитися відео можна і в мобільному додатку Gemini. Veo 2 також доступний у Google Labs через інстумент Whisk, який дає змогу створювати нові зображення, використовуючи як текстові, так і графічні підказки, а тепер анімувати їх у відео.
Контекст
Gemini – це відповідь Google компаніям Microsoft Corp. та OpenAI, які, на думку деяких експертів, швидше скористалися перевагами нинішнього буму штучного інтелекту, зокрема серед хмарних клієнтів і розробників. Тепер Google прагне заманити цих користувачів у свою екосистему за допомогою більш потужних інструментів.
Google презентував Gemini у грудні 2023-го, модель обійшла GPT-4 у більшості тестів, демонструючи потужність в аналізі наукових текстів, відео та юридичних документів. Але свято тривало недовго – одразу почалися спроби масштабувати функціональність: довга пам’ять, генерація подкастів, обробка PDF. Команда почала інтегрувати Gemini в усі продукти компанії. ChatGPT і далі випереджав Gemini за кількістю завантажень: 600 млн проти 140 млн, за даними Sensor Tower.
Детальніше про те, як створювався конкурент чату GPT – читайте тут.

Ви знайшли помилку чи неточність?
Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.