Синтезатори голосу та людська автентичність: чи здатен ШІ імітувати емоції

Синтезатори мовлення на основі штучного інтелекту нині можуть вести реалістичні розмови: розставляти акценти, шепотіти та навіть "клонувати" голоси інших людей. LIGA.Life розбирається разом з експертом, що допомагає відрізнити штучний інтелект від людського голосу під час телефонної розмови, як саме ШІ аналізує голос людини, а також як розпізнати, що це не справжній співрозмовник.

Чат-боти працюють на основі великих мовних моделей, щоб відповідати та спілкуватися набагато природніше та переконливіше. Наприклад, голосова функція ChatGPT нині може відповідати, використовуючи варіації тону та наголос на певних словах у схожий спосіб, яким людина передала б співчуття та емоції. ШІ також може вловлювати невербальні сигнали, такі як зітхання та ридання, розмовляти 50 мовами та здатний передавати акценти. Штучний інтелект навіть може телефонувати від імені користувачів, щоб допомогти із завданнями — наприклад, під час однієї демонстрації система OpenAI замовила полуницю у продавця. Про це пише BBC. У деяких випадках ця технологія використовується для шахрайства, щоб змусити людей передати гроші злочинцям.

Крім цього, нещодавно голос Девіда Аттенборо, телеведучого-натураліста та кінопродюсера, "клонували" у телепрограмі. BBC News опублікували матеріал, використовуючи озвучування з останнього серіалу BBC Аттенборо "Азія". У ролику він каже: "Якщо ви думаєте, що бачили найкраще, що може запропонувати світ природи, подумайте ще раз. Більше ніде на Землі немає стільки нерозказаних історій. Тоді ласкаво просимо до Азії". BBC показало той самий відеоролик і запитало глядачів, чи чують вони якісь відмінності. Як результат: вони звучали майже однаково, але другий був створений штучним інтелектом за допомогою перехоплення інтонацій. ШІ-голос використовується в новинах на каналах YouTube, таких як The Intellectualist, для озвучування матеріалів про війну Росії проти України та новин про Дональда Трампа.

Це не перший схожий випадок. ШІ був одним із найактуальніших питань під час страйків сценаристів та акторів. А на початку цього року голос OpenAI під назвою Sky був вилучений після запуску, через те що акторка Скарлетт Йоганссон заявила про схожість з її голосом. Вона оприлюднила заяву, що засновник OpenAI Сем Альтман звернувся до неї за дозволом використання її голосу, і компанія просунулася з планом, попри те що акторка відхилила пропозицію. Скарлетт Йоганссон додала, що голос був видалений компанією, лише коли виникла загроза судового позову.

Як створити правдоподібний діалог між ШІ та людиною

Для створення справжнього правдоподібного діалогу потрібні значні інвестиції у розробку технологій та адаптацію до кожної мови, пояснює LIGA.Life Олексій Скрипка, засновник компанії EVE.calls, що створила голосового чат-робота. Особливо складно досягти природності у довільних темах розмови. Найкращий результат досягається у вузькоспеціалізованих сценаріях, де боти можуть використовувати чітко обмежену базу знань та мати предзаписані та озвучені сценарії.

Відключити

Фото: Freepik

Експерт зазначає, що у бізнесі, залежно від потреб, використовують два підходи:Щоб прочитати цей матеріал потрібно оформити підписку LIGA PRO. Перейдіть до повної версії сторінки.

штучний інтелект ШІ

Коментарі

Щоб долучитись до дискусії, та активуйте підписку.

Упс, виникла помилка. Спробуйте пізніше.