OpenAI запустила Sora 2 – вдосконалену модель штучного інтелекту для створення відео та аудіо, яка генерує ще реалістичніші відеоролики, йдеться у повідомленні компанії.
Купуйте річну передплату на шість журналів Forbes Ukraine за ціною чотирьох номерів. Якщо ви цінуєте якість, глибину та силу реального досвіду, ця передплата саме для вас.
Деталі
- Нова версія моделі, на відміну від попередньої, здатна створювати тривалі відео з плавними сценічними переходами та реалістичною фізикою рухів. У Sora 2 усунуто недоліки, пов’язані з деформацією об’єктів і неправильним їх переміщенням, що дозволяє точно відтворювати складні дії, наприклад спортивні трюки, відповідно до фізичних законів.
- Модель забезпечує точну синхронізацію аудіо з відеорядом: діалоги, фонові звуки та ефекти гармонійно поєднуються з візуальним контентом, додаючи сценам правдоподібності. Крім того, Sora 2 дозволяє інтегрувати в згенероване середовище реальних людей або персонажів.
- Для цього достатньо надати короткий відео- чи аудіозапис, після чого об’єкт можна додати до будь-якої сцени у вигляді камео, зберігши природність рухів і голосу.
- Разом із моделлю OpenAI запустила мобільний додаток Sora для iOS, який дозволяє створювати, редагувати та поширювати відео. Додаток має інструменти для управління контентом, обмеження для молодшої аудиторії та захист від матеріалів із насильством.
- Наразі додаток Sora доступний лише в США та Канаді за запрошеннями від компанії. Кожен користувач із доступом може запросити ще чотирьох осіб. Інформація про вихід додатка на Android поки відсутня.
- Sora 2 на старті буде безкоштовною, але з певними обмеженнями, щоб користувачі могли ознайомитися з її можливостями. Підписники ChatGPT Pro отримають доступ до експериментальної версії Sora 2 Pro на сайті sora.com, а згодом – у додатку Sora. Компанія також планує інтеграцію Sora 2 в API.
Контекст
У грудні 2024 року OpenAI представила модель штучного інтелекту Sora, яка генерує відео за текстовими запитами, для користувачів ChatGPT Plus і Pro. Користувачі можуть створювати відеоролики з роздільною здатністю до 1080p, тривалістю до 20 секунд у широкоекранному, вертикальному або квадратному форматі.
Перша версія Sora вражала візуальними ефектами, але не мала звуку, нагадуючи «німе кіно». Натомість конкурент від Google, модель Veo 3, продемонструвала можливість створення синхронізованої аудіодоріжки – від звуку лиття я кави до гомону кав’ярні, що забезпечує повноцінний кінематографічний досвід.
Ви знайшли помилку чи неточність?
Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.