Можно ли сделать качественное видео для соцсетей, используя исключительно инструменты искусственного интеллекта? Конечно. Главное – ИИ требует максимально конкретной постановки задачи. Чем подробнее ваш промпт (задача для ИИ), тем качественнее результат. Forbes Ukraine попросил Starlight Digital, которая входит в медиакомпанию Starlight Media, сделать короткое видео на основе нашей статьи Forbes. Что из этого вышло – рассказывает операционный директор компании Виталий Гусев.
Amazon інвестує мільярди доларів у ШІ, роботів та машинне навчання. Якими принципами й правилами керується компанія?
Дізнайтеся вже 22 листопада на Forbes Tech 2024. Купуйте квиток за посиланням!
Сейчас происходят значительные изменения в индустрии создания контента. Искусственный интеллект трансформировал работу креативной индустрии в более технологичную. Но, кроме инновационности, ИИ выгоден создателям контента с точки зрения бюджетов. Средняя стоимость телевизионного контента – примерно $22 000 в час, а созданного с помощью искусственного интеллекта – примерно в семь раз дешевле. В ближайшее время ИИ вряд ли заменит телевизионное качество контента, но уже сейчас творческие команды используют его для создания вижуалов, в работе со сценариями и для другого.
Мы взяли текст Forbes Ukraine об украинском приложении с гороскопами Nebula. Используя пять ИИ-инструментов (ChatGPT, Eleven Labs, Udio, Midjourney, Runway ML), сделали с него видео для соцсетей на полторы минуты.
1. Сценарий
ChatGPT – $20 персональный аккаунт или $30 Teams аккаунт
Как создать сценарий для риллз из большого текста? Поможет один из самых простых и доступных вариантов ChatGPT. Загружаете публикацию, прописываете квоту слов, промпт – «выделить из текста ключевые, главные тезисы на шесть предложений» – и получаете сценарий. Выделять главное в больших объемах информации – одна из приоритетных задач инструментов ИИ.
И это касается не только текстов, есть нейронные сети, работающие с видео. К примеру, вы подписаны на интересный научпоп, но у вас нет двух свободных часов, чтобы смотреть документалку. «Сделай мне шорт из этого видео или перескажи в одном абзаце», – ИИ вместо вас за секунду пересматривает видео, расшифровывает и выдает главное из текста.
2. Генерация закадрового голоса
Eleven Labs – от $11 в месяц
На сегодняшний день – один из самых лучших инструментов. Он почти идеально работает с английским языком, однако с украинским иногда возникают сложности – не понимает ударений, например, и нет инструментов, которые бы это корректировали. Поэтому используем технологические приемы: ставим в тексте значок ударения с помощью клавиатуры или делаем букву заглавной. Если эти варианты не работают, редактируем текст, заменяем «неудобное» слово на другое.
Что касается интонации и посыла, в информативной подаче лучше работают робоголоса. Если закадровый голос должен быть более экспрессивным, на платформе Eleven Labs для этого есть отдельные инструменты.
Учтите, что вариативность каждой генерации будет разной. Так работают все инструменты ИИ. И даже одно и то же предложение «Привет, я Мария» при каждом следующем запросе будет иметь разные интонацию, ударения и скорость.
Есть pre-made голоса, которые предлагает сама платформа, либо можно сгенерировать собственный голос – выбрать пол, диапазон возраста (молодой, средний, преклонный) и акцент. Он также может клонировать голос. Вы делаете запись на минуту текста, а затем используете свой голос для начитки. Даже некоторые особенности и интонации будут сохранены. В таком случае, кстати, украинская начитка станет более совершенной.
3. Генерация музыкального сопровождения
Udio – бесплатно
Относительно новый инструмент, но среди альтернативных – самый лучший. Главное – максимально качественно задать промпт. Делаем запрос на музыку для риллз об астрологии, и Udio предлагает варианты. Если понимаете, что это совсем «не оттуда», то нужно задействовать вокабуляр. Описать музыку словами, чтобы максимально четко дать задание ИИ, а это самое сложное. Нужно обладать музыкальным образованием, знать сольфеджио и другие тонкости. Ищем выход – обращаемся к ChatGPT и просим: «Создай мне промпт для генерации музыкальной композиции, которая была бы уместна для риллз, о магии, картах таро и астрологии».
Генерация музыки в Udio происходит в несколько этапов. Основной текстовый промпт создает середину музыкального трека. Если она вас удовлетворяет, переходим к созданию начала и конца трека.
С помощью Udio можно создавать инструментальные композиции и вокальные. Для вокальных композиций лирику можно использовать как свою, так и задавать промпт для написания ИИ-инструментом.
4. Генерация изображений
Midjourney – $30 в месяц
Для риллз Forbes наш гуру среди экспертов, главный режиссер ИИ Владислав, использовал как фактический материал – скриншоты с сайта, приложения Nebula, фото СЕО и его команды, так и созданные ИИ – это экстрасенсы, прорицательницы и другие изображения на магическую тему. Для этого мы поработали с одним из лучших генераторов изображений – Midjourney.
Преимущество инструмента в том, что он дает наиболее стилистически качественные изображения. Если хотите вижуал, приближенный к киношному стилю, то он вам такой и выдаст. Реалистичный, акварельный. В стилях Midjourney разбирается действительно хорошо.
Что этот ИИ-инструмент не может? Понимать сложные запросы. Если задать промпт «женщина в красном платье с чашечкой кофе, а рядом рыжая кошка», то он либо пропустит кофе, либо кошку, либо платье будет голубым. Для изображений вроде астрологии Midjourney сработает хорошо.
Он сохраняет изображение в различных параметрах, таких как 16х9, 3х4, 1х1, 9х16, каких угодно. Также есть инструменты, позволяющие использовать первый имидж, созданный в определенном стиле, как референс для всех последующих изображений.
5. Анимация изображений
Runway ML – $100 в месяц (стоит брать лучшую подписку, чтобы не ограничиваться количеством генераций)
Имидж, который мы сделали из Midjourney, является первым кадром нашего анимационного видео. Используем его в качестве референса, загружаем в Runway и работаем с ним.
Ставим задачу: голова будет поворачиваться вправо, рука подниматься или солнце будет приближаться. Однако это тот инструмент, где все работает, как лотерея. Произведя определенные манипуляции, выделив зоны, задав движение камеры, мы нажимаем «генерация» – и получаем результат. И он нас может либо устроить, либо нет. Тогда корректируем запрос до того момента, пока анимация не станет такой, как нужно. Со временем приходит опыт, какие действия помогают сделать анимацию максимально корректной.
Лучше всего анимировать изображение, представленное крупным планом – портретное фронтальное фото человека. Можно использовать инструмент липсинга. Таким образом, СЕО Nebula Федоров «рассказал» в нашем риллзе, сколько денег заработала компания за последний год. Для генерации голоса мы использовали ранее упомянутый Eleven Labs. Так мы показали, что вроде бы брали у него интервью.
О чем следует знать, используя инструменты ИИ для создания контента
Ни один инструмент не будет с вами работать, если тема касается насилия или чего-то безнравственного. Надо понимать, что в случае с ИИ работает презумпция виновности. В каждом вашем запросе сразу будет искаться что-то, что вы хотите сделать неэтично, – порнографические материалы или изображение насилия. Вы хотите сгенерировать картинку, где две женщины держатся за руки, ИИ подумает, что это может быть лесбийское порно. Можно ли этого избежать? В таком случае будет легче смириться и искать другое решение.
Вы нашли ошибку или неточность?
Оставьте отзыв для редакции. Мы учтем ваши замечания как можно скорее.