Президент України Володимир Зеленський дав тригодинне інтервʼю подкастеру Лексу Фрідману. Окрім важливого фокуса розмови про переговори, гарантії безпеки та вступ України до НАТО, в її реалізації є цікава деталь – технічна. Як так сталося, що інтервʼю можна подивитися трьома мовами одночасно – українською, англійською та російською. Розповідає автор подкасту «Інше інтерв’ю» Володимир Анфімов.
Поки всі обговорюють інтерв’ю Володимира Зеленського американському блогеру Лексу Фрідману, зупинюся на частині, яка залишилася за лаштунками, – технічному складнику.
Їхня розмова відбувалася одразу трьома мовами: англійською (володіють обидва спікери), російською (аналогічно) і українською (володіє лише Зеленський). За три години спікери змінювали мови як рукавички, часто починаючи фразу однією і переходячи на іншу. Але, якщо ви зайдете на YouTube, побачите, що у вас є можливість слухати це інтерв’ю повністю однією з цих мов. Також є можливість обрати оригінальну версію – змішану.
Найцікавіше, що переклад звучить саме голосами Зеленського і Фрідмана, а не якогось перекладача. Як це вдалося?
Історичний бекграунд
Алекс Фрідман – передусім дослідник та співробітник Массачусетського технологічного інституту, а вже потім – подкастер. Його сфера інтересів – це штучний інтелект та Big Data. А ще він гарний знайомий Ілона Маска. З американським бізнесменом Фрідман познайомився після того, як опублікував дослідження, що пізніше було розкритиковане колегами-науковцями.
У ньому Фрідман доходить висновку, що водії, які використовують напівавтономні транспортні засоби, залишаються зосередженими. Іншими словами, водіння автомобілем Tesla в режимі автопілота не змінює психологічний стан водія. Отже, він може в будь-який час втрутитися і виправити ситуацію.
Коли це дослідження потрапило в поле зору Маска, він погодився взяти участь у записі його подкасту Фрідмана, який тоді називався The Artificial Intelligence Podcast — «Подкаст про штучний інтелект».
Від історії до сьогодення
Так ось, саме штучний інтелект, а саме американський стартап ElevenLabs, заснований вихідцями з Польщі, які у дитинстві страждали від неякісного дубляжу голлівудських фільмів, допоміг зробити інтерв’ю Зеленського Фрідману дійсно унікальним.
Що в ньому особливого?
Передусім ШІ зберіг голос Зеленського автентичним, навіть у перекладі. Його інтонації, емоції та стиль мовлення відчутні, незалежно від того, якою мовою ви слухаєте.
По-друге, три години інтерв’ю – це величезний обсяг роботи для команди, але ШІ дозволяє зробити таку адаптацію швидко і якісно.
Насправді за словами Фрідмана, робота по адаптації цього інтерв’ю не була повністю автоматизованою. Зокрема, переклад текстів різними мовами здійснювався у співпраці професійних перекладачів зі штучним інтелектом. Впевнений, також були залучені редактори, які «відшліфовували» фінальний варіант.
А ось дубляж повністю заслуга ШІ, що дійсно вражає. Як і інші приклади використання штучного інтелекту в медіа.
Радіо-медіа-ШІ як уповільнена бомба
Поява незвичної радіостанції в Польщі без «живих» ведучих – один з прикладів.
Восени 2024 року медіахолдинг Radio Kraków оголосив про перезапуск однієї зі своїх станцій 0FF Radio у новому форматі. Мета – залучити молоду аудиторію, пропонуючи програми від віртуальних ведучих та інтерактивні шоу, створені за допомогою інструментів ШІ.
Але ведучими станція не обмежилася і, зокрема, видала в ефір інтервʼю з віртуальною версією Віслави Шимборської, польської поетеси та лауреатки Нобелівської премії з літератури. Віслава померла у 2012 році, проте за допомогою технологій ШІ вдалося зімітувати її участь у розмові. Кажуть, звучало дуже переконливо. З усім тим станцію незабаром закрили, не без скандалу.
За словами редакторів станції, їх експеримент показав, наскільки багато сфер залишаються неврегульованими, коли йдеться про використання штучного інтелекту в медіа – етичні норми, маркування контенту, створеного із залученням ШІ, авторські права.
Але головною причиною зміни формату станції стала реакція суспільства.
Багато хто звинувачував експериментаторів у намаганні «замінити людей машинами». Колись ми вже таке чули, чи не так?
Хай там як, тема використання ШІ в медіа потребує подальших досліджень. Вже зараз зрозуміло, що у монети дві сторони.
Для креаторів розвиток ШІ відкриває все більший доступ до нових аудиторій. Зокрема, позбавившись мовного барʼєра, тепер є можливість створювати продукт рідною мовою і робити версії для слухачів і глядачів у будь-якому куточку світу.
Також тепер буквально одна людина, маючи доступ до технологій ШІ, може генерувати сотні голосів і зображень, створюючи нові альтернативні світи.
З іншої сторони, і це найголовніше, з розвитком штучного інтелекту в медіа виникає безліч ризиків. Зокрема неконтрольоване поширення діпфейків, коли буде неможливо відрізнити оригінальний голос та зображення від синтезованих, а дійсно сказане – від брехні та маніпуляції.
Це направду сказав Зеленський? Таку заяву зробив обраний американський президент Дональд Трамп?
Таких питань у майбутньому ми будемо чути все більше. Тому і виходить, що без розвитку критичного мислення у суспільства та належного контролю з боку державних інституцій розвиток ШІ в медіа може стати справжньою бомбою уповільненої дії.
Ви знайшли помилку чи неточність?
Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.