На конференції AI Marketing Day Орися Хім’як, PR&Comms в компанії  Respeecher, розповіла про голлівудські технології на основі штучного інтелекту й як це можна використати для інтернет-маркетингу.

Сучасні технології та PR

PR – дуже недооцінений канал для маркетологів, і часто через те, що його важко виміряти, важко помітити, як він впливає на ліди. PR може зробити продукт вірусним, зробити вчора невідомий продукт сьогодні не просто відомим, але й принести йому перші мільйони завантажень. Це досить потужний інструмент.

Я сподіваюся, що сьогодні взаємодії з технологією клонування голосу, якою займається Respeecher та низка інших компаній, трохи маркетингу, креативу та піару можуть допомогти підняти будь-який бізнес і вплинути на цілу низку параметрів – SEO, ліди, підвищити кількість лідів, аутріч, вплинути на репутацію бренду.

Що таке клонування голосу?

Я хочу вірити, що ви хоча б краєм вуха чули про Respeecher і про клонування голосу за допомогою штучного інтелекту. Якщо ні, я тут, щоб розповісти вам про це. Як відбувається і працює клонування голосу? По-перше, існує два підвиди цієї технології: speech-to-speech і text-to-speech.

Розглянемо спершу text-to-speech. Коли ви друкуєте текст, наприклад, через різні не дуже етичні інструменти, будь-який текст може бути перетворений на голос певної особи. Це не дуже етично, оскільки публічні люди часто не дають права на використання свого голосу. Попередній лектор згадав компанію, яка просто викладає голоси відомих людей та політиків в інтернет без їхнього дозволу. Це неправильно і може становити загрозу, якщо технологію використовувати неетично. Недоліки text-to-speech полягають у тому, що він має роботичний голос, який не передає нюанси, артикуляцію та емоції.

Speech-to-speech – це коли голосовий актор або ви самі надиктовуєте аудіодоріжку, і поверх неї накладається голос певної людини – історичної постаті, митця або артиста, якщо у вас є на це дозвіл. Це називається speech-to-speech. Ми в Respeecher працюємо з обома профілями, але speech-to-speech є нашим основним фокусом, оскільки він дуже якісний. Саме за це борються голлівудські компанії. Для них важливо передати кожну емоцію та манеру спілкування, і цього можна досягти саме через speech-to-speech.

 

Як працює технологія клонування голосу

Кілька важливих аспектів, як це працює. Припустимо, ви хочете відтворити голос Богдана Ступки або озвучити книгу, не витрачаючи кілька днів на запис у студії. Ви даєте право на використання свого голосу. Потрібно мінімум 30 хвилин вашого аудіо. Це може бути інтерв’ю, монологи або надиктовані аудіо, важливо, щоб це був чистий звук, а не діалоги. 30 хвилин чистого аудіо достатньо для натренування AI-моделі.

Натренування моделі може зайняти кілька днів, іноді навіть один день, якщо даних достатньо. Важливо розуміти, що технологія клонування голосу не замінює акторів і дикторів – їхня участь все одно потрібна. Наприклад, для відтворення голосу Богдана Ступки або Едіт Піаф потрібен голосовий актор, який зможе копіювати манеру спілкування цієї людини.

Для фільму, де ми відтворювали голос Едіт Піаф, була залучена людина, яка начитувала текст, і на цей запис накладався голос Едіт Піаф. Так само, якщо ви хочете озвучити свою книгу, потрібна людина, яка буде начитувати текст, а потім на її голос буде накладено ваш голос за допомогою AI-моделі. Це дозволить вам зекономити час і отримати повноцінну аудіокнигу з вашим відтвореним голосом завдяки штучному інтелекту.

Приклад використання технології

У нас був мікропроєкт на початку війни, коли ми зрозуміли, що дуже важливо залучити якомога більше відомих і впливових людей, щоб привернути увагу до України. Одним із таких супер дружніх людей був Бер Грилз. Я не знаю, чи ви дивилися його передачі, але для мене це був дуже емоційний момент, тому що, по-перше, він щиро підтримує Україну, а по-друге, він погодився, щоб ми конвертували його голос на українську.

На жаль, він поки що не володіє українською. Завдяки технології, що називається language conversion, ваш голос може звучати всіма мовами – мандаринською, італійською, іспанською. Це також відкриває можливості для різних комбінацій. Наприклад, для кол-центрів це може бути чудова опція, або для музикантів, які хочуть перекласти свій альбом на всі мови світу.

Крім мовних конвертацій, ви також можете зробити lipsync, щоб виглядало так, ніби людина справді говорить відповідною мовою. Круто, що видавці книги Бера Грилза, які його особисто знають, казали, що голос звучить дуже схоже, хоча їм це трохи дивно, бо вони не володіють українською. Це приємні моменти.

Голлівудські голоси, які Respeecher відтворював

Голлівудські голоси, які Respeecher відтворював

Якщо коротко про те, що Respeecher вже робив – голос Едіт Піаф для Warner Music, голос Дарта Вейдера. Це був один із найкращих і найсвітліших моментів, оскільки кілька місяців після початку повномасштабної війни цілий ряд закордонних медіа вийшли із заголовком про те, що попри війну в Україні працюють бізнеси, створюють голлівудські проєкти, навіть масштабу для Disney+. Голос Дарта Вейдера для останніх серіалів «Зоряних війн» був створений в Україні, київською командою. Це був для мене персонально дуже приємний і важливий момент, корисний для підтримки проукраїнських наративів.

Ми також відтворювали голос Елвіса Преслі. Якщо ви хоча б трохи дивитесь українське телебачення, то могли бачити шоу «Україна має талант», аналог американського «America's Got Talent». Там аватар Елвіса Преслі спілкується його голосом, і цей голос, саме спіч, не спів, відтворював Respeecher.

Недавній проєкт, про який я детально розповім сьогодні, приніс нам багато в контексті піару і маркетингової активності – це відтворення голосу Джеймса Стюарта. Хоча я не росла на цьому фільмі, багато хто знайомий з ним, бо це золота ера Голлівуду, і Джеймс Стюарт вважається одним із облич цієї ери, оскароносним актором.

Ми також відтворювали голос Елвіса Преслі

Звичайно, ми мали дозвіл на використання голосу Елвіса Преслі. У цьому випадку lipsync виглядає ідеально. Це реальний персонаж, який відтворює манеру співу Елвіса, а голос в інтро на самому початку аудіо був дійсно відтворений. Це справді крутий момент, що ви можете взаємодіяти з голосами, які настільки відомі в Голлівуді.

З ким співпрацювали

З ким співпрацювали

Це ряд компаній, в яких в титрах був Respeecher, і як маркер того, що ця технологія зараз дійсно дуже активна і дуже часто використовується різними платформами, і не тільки телевізійними. 

Як ви можете застосувати цю технологію у своєму бізнесі

Дуже логічне і правильне питання, яке у вас може виникнути: як ця голлівудська історія може бути корисною для вашого бізнесу? Як ви можете використовувати її у різних напрямках, як вона може вам бути корисною, і яке відношення це має до креативу, піару та вірусних кампаній, про які я згадувала раніше?

Приклад застосування технології

Перше класне застосування – це події. Якщо це масштабна подія, така як Олімпійські Ігри, фешн-шоу або виступи найвідоміших українських дизайнерів, навіть якщо їх вже, на жаль, немає в живих, вони можуть бути тими персонами, які відкриють подію. Наприклад, у США є дуже важлива особа для спортивної культури – Вінс Ломбарді. У 2021 році ми відтворювали його голос на події Super Bowl. Як маркетологи, ви, напевно, знайомі з цією подією, до якої прикуті погляди мільйонів американців. Для нас аналогічною подією може бути Євробачення. Тобто, для таких подій відтворити голоси людей, з якими резонує наша аудиторія, цілком реальний сценарій. Це точно приверне велику увагу від медіа, як українських, так і закордонних, якщо це те, чого ви шукаєте.

Напрямки подій можуть бути надзвичайно різними – від спортивних до культурних, історичних або освітніх проєктів. Соціальні кампанії також мають великий потенціал. Медіа часто уникають писати про бізнес, але якщо ви проводите соціальну кампанію, яка має на меті збереження культурного ландшафту чи пам'яток архітектури, або музей може використовувати аудіо з архівів, наприклад, голос Марії Примаченко для озвучення її робіт. Це можна зробити завдяки нашій технології. Це може бути кампанія від вас, вашої організації або бренду.

Історичні персонажі та історичні події 

Історичні персонажі та історичні події

Чи чули ви про випадок з книгою про Василя Стуса? Це був гучний кейс. Одіозний персонаж Віктор Медведчук намагався заборонити книгу, що спричинило ефект Барбари Стрейзанд: через спробу заборони книга Вахтанга Кіпіані привернула ще більше уваги і розпродалася за лічені дні. Моя велика мрія була озвучити цю книгу голосом Стуса. Це потребувало б колосальної роботи – знайти диктора, отримати права на використання голосу тощо. Але це могло б стати додатковою потужною кампанією.

На одному зі слайдів ви бачите, що ми отримали премію Emmy за відтворення голосу Президента Ніксона. Це був дуже обережний і важливий момент. Ми не співпрацюємо з політичними кампаніями. Ви, напевно, бачили в інтернеті забавні відео, де відомі особи говорять нісенітниці. Наприклад, військові задачі озвучують голосом Головнокомандувача чи Президента Зеленського. Це становить загрозу. Відкритий доступ до голосів для таких цілей – це неправильно.

Якщо у вас є соціальна мета чи місія, і ви хочете отримати право на використання голосу відомої людини, важливо затвердити текст, який буде озвучено. Наприклад, якщо ви хочете використовувати голос Василя Стуса, потрібно затвердити текст, щоб голосом Стуса не озвучували нісенітниці. Це важливий етичний момент, і Respeecher бачить свою місію в комунікації та поясненні важливості етичного використання голосів. Технологія може бути корисною, але її потрібно використовувати обережно, як ніж, який може створювати неймовірні витвори мистецтва, але може і завдати шкоди.

Корпоративні рішення: аудіокниги, персоналізовані сповіщення, подкасти 

Корпоративні рішення: аудіокниги, персоналізовані сповіщення, подкасти

Як я забрифовувала на початку, ця технологія також відкриває широкі можливості для корпоративного використання. На одному зі слайдів ви бачите харизматичного чоловіка на ім'я Рейд Хоффман, який, можливо, вам відомий як співзасновник LinkedIn. Він, будучи дуже зайнятою особистістю, найняв диктора для озвучення своєї книги про штучний інтелект. Це дозволило йому персоналізувати повідомлення для своїх читачів, накладаючи свій голос на прочитані тексти, що дуже позитивно сприйняли його прихильники.

Ця можливість персоналізації може бути дуже корисною для вашої компанії. Якщо ваш CEO або керівництво надзвичайно зайняте, вони можуть записати персоналізовані повідомлення для співробітників чи клієнтів. Це можуть бути поп-ап повідомлення на вашому внутрішньому порталі чи персоналізовані запрошення в додатку або на сайті через пуш-сповіщення. Наприклад, якщо ви ведете фешн-бренд, ви можете використовувати цю технологію для створення персоналізованих повідомлень, які залучать вашу аудиторію.

Ми мали досвід роботи в Індії, де голос одного з їхніх відомих кіноперсонажів, Шурхана, був використаний для озвучення понад 400 різних рекламних матеріалів. Більшість з них були персоналізовані під різні аудиторії, що дозволило збільшити ефективність комунікації.

Застосування цієї технології також може включати створення персоналізованих сповіщень в чат-ботах, що полегшить взаємодію з клієнтами та співробітниками. Це є одним з багатьох форматів, які можуть бути корисними для впровадження цієї інноваційної технології у вашому бізнесі.

Для мобільних додатків і чатботів

Для мобільних додатків і чатботів

Не знаю, як у вас з ментальним здоров'ям, але, мабуть, це риторичне питання в Україні – у всіх кепсько. Проте для таких людей, як ми всі, є додаток Calm, який переважно спрямований на медитацію. Вони часто залучають до свого додатку відомих акторів для озвучення медитацій та інших текстів – таких як Меттью Макконахі та інші. Раніше я згадувала про Джеймса Стюарта, який читав різні Різдвяні історії, відомі як «Christmas Stories», для цього додатку перед сном. Його голос став особливо значущим для цілої генерації в США, бо цей актор символізує добре відомий фільмовий образ, на якому виросло багато людей із цієї країни.

Голлівуд та штучний інтелект

Отже, голосом AI може опрацьовувати Respeecher. Для мене особисто одним з таких голосів є Богдан Ступка. Його озвучка фільмів або аудіо, де він читає вірші Ліни Костенко, є надзвичайно трепетним моментом, що, я впевнена, відчувають інші. Використання голосів таких персонажів може стати потужним інструментом для викликання емоцій у вашої аудиторії і, можливо, сприяти посиленню емпатії до вашої компанії. Особливо це стосується ситуацій, коли ваша компанія пропагує якийсь культурний чи соціальний аспект.

Ми успішно завершили проєкт для Calm, американського додатку, створивши голос Джиммі Стюарта. Це ще один приклад того, як закордонні медіа люблять поєднувати різні сфери і теми, такі як ментальне здоров'я і штучний інтелект. Щоб краще розуміти складнощі роботи з піаром в контексті штучного інтелекту, треба згадати літній масштабний страйк в Голлівуді. Півтори кінострічки було перенесено, актори відмовились працювати через умови, що змінювались, і через штучний інтелект. Вони бачать загрозу в неетичних компаніях, які можуть купувати їхні голоси й використовувати їх не на один, а на всі проекти. Таким чином, багато медіа писали лише негативні статті про штучний інтелект.

Цей період був для мене справжнім викликом – просувати щось з позитивними конотаціями, щоб показати, що ми відрізняємося від інших, що наша компанія працює етично. Парадокс цієї кампанії полягає в тому, що ми змогли отримати позитивний піар, уникнувши заголовків про те, що «AI знищить світ» або «вкраде вашу роботу».

Сила світового піару

Сила світового піару

Ми отримали згадки в таких авторитетних медіа, як Variety, The New York Times, CNN, People, і Huffpost, що стало справжнім крутим бустом для нашого сайту. Трафік у той день був колосальний, що дало нам значний експозиційний ефект, але при цьому ми інвестували мінімум коштів — фактично, нульовий бюджет. Наш клієнт оплатив конвертацію голосу, і ми спільно запланували кампанію.

Сила світового піару

Такі згадки в медіа мають беззаперечний авторитет. Орієнтуючись на американські ринки протягом останніх п'яти років, я зосереджувалася на піарі, і це дозволяє мені краще розуміти, що це означає мати згадки в таких виданнях. Креативні й ефективні кампанії значно спрощують взаємодію з такими ринками, адже конкуренція в закордонних медіа надзвичайно висока, і здобути їхню увагу — завдання непросте. Більшість журналістів розуміє, що величезна цінність у їхнього уваги, бо від неї можуть залежати великі клієнти та значні партнерства.

Ми побачили це після публікації статті про голос Дарта Вейдера. Один з найбільших гравців технологічного ринку звернув на нас увагу, прочитавши цю статтю. Це підкреслює, як могутнім інструментом може бути правильно спланований піар для вашої компанії. Це не основний канал продажів, але точно посіває насіння, яке виростає в сильну основу для продажів і довіри, а також ефективного маркетингу, що дозволяє залучати нові ліди та встановлювати контакти з потенційними клієнтами.

Результати роботи з технологією клонування голосу

Загалом, кампанія для додатку Calm з Джеймсом Стюартом зробила значний вплив, об'єднуючи креатив, mental health, штучний інтелект і кінематографію. Впізнаваність була надзвичайно важлива. На сьогоднішній день досягти такого рівня складно через рост конкуренції — Respeecher працює вже п'ять років, і лише за останній рік з'явилося щонайменше десять конкуруючих компаній.

Позитивний піар — це справді виклик, особливо в контексті медіа, таких як The New York Times, які, зазвичай, не ставляться позитивно до штучного інтелекту. Їхні статті часто зосереджені на потенційних загрозах, що несе інтелектуальна технологія. Отже, в такому контексті наша кампанія стала унікальним випадком і, можливо, прецедентом для продуктів, які орієнтовані на розвиток штучного інтелекту.

Нові ліди — це велика цінність. Ми ніколи не платимо за публікації, це правда, і отримати лінк може бути вельми складно. Ми використовуємо стратегію, де ми обов'язково розміщуємо інформацію про наші проекти на блозі, що допомагає нам залучити увагу великих медійних сайтів. Це сприяє покращенню нашого рейтингу в пошукових системах, що важливо для SEO-стратегій і просування нашого сайту в топи пошукових запитів.

Хочу також зазначити, що отримання згадок у таких авторитетних виданнях, як The New York Times, Variety, і Washington Post, дозволяє нам зробити глибокий аналіз аудиторії та порівняти їх, що є важливим для подальшого планування наших медійних кампаній.

Застосування голосів героїв

Застосування голосів героїв

Говорячи про застосування голосів героїв, які провокують емоції, я вважаю, що такий підхід може працювати добре навіть на українському ринку. В Україні не складно отримати піар. Наші журналісти цінують креативні кампанії, хоча, на жаль, вони не так часто з ними працюють. Але можливо, я можу запропонувати ідеї щодо того, що можна робити.

Наприклад, у соціальній кампанії дуже ефективним може бути застосування голосу відомих особистостей для популяризації важливих тем, таких як День боротьби з раком чи профілактика раку грудей. Співпраця з відомими особистостями, наприклад з Ірмою Вітовською, для запису персоналізованих повідомлень для клінік чи Міністерства Здоров’я може бути відмінним прикладом. Такі кампанії гарантовано привернуть увагу медіа та соцмереж, що дозволить досягти значного впливу.

Важливо, щоб голоси, які ви обираєте, справжньо провокували емоції, можливо, навіть ностальгію або спогади. Наприклад, артисти, чиї пісні ми слухали із задоволенням, такі як Скрябін або Брати Гадюкіни, можуть стати частиною вашої креативної стратегії. Наприклад, фільм про Скрябіна може стати відмінною співпрацею. Також голоси героїв мультфільмів можуть бути дуже ефективними для вашого бізнесу.

Такі ініціативи не обов'язково повинні бути обмежені до розважальних сфер. Голоси відомих особистостей можуть бути ефективними і в більш серйозних темах. Головне, щоб вони були аутентичними і викликали емоційний відгук в аудиторії.

Ускладнення роботи з технологією клонування голосу

Ускладнення роботи з технологією клонування голосу

Не можна не згадати про об'єктивні складнощі та недоліки роботи з технологією клонування голосу. Наприклад, якщо йдеться про speech-to-speech технології, варто враховувати, що вони не є дешевими. Наша компанія в основному спрямована на співпрацю з голлівудськими студіями та міжнародними ринками, і для нас Україна не є основним напрямком. Однак я впевнена, що на ринку є інші продукти, які працюють у цій сфері за більш доступні ціни.

Одним із важливих аспектів є відтворення голосу осіб, які вже не живі, зокрема тих, хто жив у 60-х роках або навіть більше століття тому. Ми мали досвід відтворення голосів зі старих фонографів, і це було вражаюче. Однак такі проекти вимагають значних зусиль і часу для тренування AI-моделей через недостатню якість вихідних даних.

Іншою складністю є процес отримання необхідних дозволів. Це може виявитися доволі складною задачею, оскільки багато людей чутливі до використання їхнього голосу без їхньої згоди. Наприклад, коли ми планували озвучувати фільм про відомого українського артиста, ми зіткнулися з відмовою одного з його братів, що перешкодило продовженню процесу. В США права на голоси померлих артистів часто належать їхнім сім'ям або юридичним особам, які купили ці права і вимагають відшкодування за їх використання.

Не останнім аспектом є етичні питання. Технологія клонування голосу може викликати обурення серед тих, хто стурбований приватністю або етичними аспектами її використання. Чітке комунікування процесів і зобов'язань щодо використання голосів може допомогти зменшити сумніви і побоювання.

З моїм досвідом роботи я бачила, що навіть українські та міжнародні медіа можуть реагувати дуже позитивно на такі інноваційні підходи, якщо правильно позиціонувати їх у своїй комунікації.