Apple, Google та інші компанії використовують ШІ-технологію для створення аудіокниг. Wall Street Journal зазирнув за лаштунки стартапу DeepZen, який активно займається розвитком ШІ для цієї галузі. Forbes пропонує ключові факти з матеріалу
Едвард Герман, нині покійний американський актор, за життя озвучив не один десяток книжок, але майже через десять років після смерті виконавця його голосом зазвучали ще кілька творів.
Лондонський ШІ-стартап DeepZen отримав дозвіл у родичів актора на використання записів голосу Германа, щоб навчити свою модель генерувати голос та інтонації актора. Син Германа був приголомшений отриманим результатом і схожістю з голосом батька.
Генеративний ШІ не вперше використовують для озвучення аудіокниг. Тисячі книжок в озвученні ШІ вже можна знайти на популярних маркетплейсах, таких як Apple Books і Google Play Books. Audible, найбільший аудіокнижковий сервіс США від Amazon, ще не може таким похвалитися, але компанія оцінює таку можливість.
Найбільші американські видавництва ще не надто часто користуються цією технологією, а радше іноді звертаються до неї для маркетингу. Проте для малих видавництв і маловідомих письменників, яким важко потягнути витрати на професійний запис аудіокниги (принаймні $5000), ШІ – це шанс вийти на цей сегмент ринку.
Apple і Google повідомили, що дозволять користувачам безкоштовно створювати аудіокниги за допомогою спеціальних ШІ-програм. Вони натреновані на голосах реальних людей.
За словами Чарльза Воткінса, директора видавництва University of Michigan Press, завдяки безкоштовній програмі озвучення аудіокниг від Google, його компанія змогла створити аудіоверсії близько 100 книжок, які інакше озвучені не були б.
Актор звукозапису Скотт Брік вважає, що автоозвучення більше підходить для науково-популярної літератури, коли актори та читачі емоційно не привʼязані до твору.
Тейлан Каміс, гендиректор і співзасновник DeepZen, розповів, що вони залучили понад 30 професійних акторів, щоб навчити ШІ вловлювати й відтворювати увесь спектр людських емоцій, і хочуть додати до своєї бібліотеки ще багато голосів відомих знаменитостей, які померли.
Акторка Мелісса Папель, яка працює на DeepZen, вважає, що навіть із такою технологією у акторів звукозапису ще достатньо роботи, хоча у майбутньому ШІ може зовсім забрати їхній хліб.
За словами Каміса, DeepZen платить їм визначену ставку, а також роялті, яке залежить від доходів компанії від різних проєктів і виплачується протягом кількох років.
Джеффрі Беннет, генеральний радник Американської гільдії акторів і Американської федерації акторів радіо і телебачення (профспілка), очікує, що ШІ врешті створить революцію в індустрії.
«Усе, що ми зараз бачимо та чуємо, з часом ставатиме кращим і кращим, – сказав він. – Профспілка працює над захистом прав на записи голосів акторів і їхнє відтворення. Та ми не вважаємо, що професійні актори звукозапису з цим не впораються».
Видавництва та ШІ
Аудіокниги – це дуже успішний сегмент індустрії. Згідно з Асоціацією американських книговидавців, продажі аудіокнижок минулого року виросли на 7%, а Circana BookScan повідомляє, що продажі друкованих творів впали на 5,8%.
Гендиректор Barnes & Noble Джеймс Донт каже, що його компанія не проти продавати згенеровані ШІ аудіокниги, якщо тільки автори чітко повідомляють про цей факт.
Речниця Audible впевнена, що «професійне озвучення книжок залишиться основою компанії», але й для автоматично згенерованих аудіокниг у них знайдеться місце. Такої ж думки і Hachette Book Group.
HarperCollins Publishers використовує ШІ-озвучення від Google для промацування іноземних ринків, щоб оцінити реакцію споживачів. А нещодавно компанія почала розсилати аудіотвори, згенеровані за допомогою програми DeepZen, ритейлерам, оглядачам і критикам перед публікацією книжки. HarperCollins не продає такі ШІ-аудіокниги в США.
Стартап DeepZen розповів, що підписав угоди з 35 видавцями в США та працює з 25 письменниками.
ШІ-генератор DeepZen використовує ПЗ на основі машинного навчання й відтворює те, як людина говорить, і характеристики її голосу. Він може додати емоції та зосередитися на словах, що важко вимовляються. Гендиректор компанії вважає, що так створювати книги простіше, ніж за допомогою професійного актора.
Окрім прав на голос Германа, DeepZen також робить ставку на голоси інших покійних зірок і намагається отримати на них права.
«Ми хочемо розширити свою бібліотеку, але не можемо поки розкривати всі секрети», – каже Каміс.
Ви знайшли помилку чи неточність?
Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.