Синтезатори голосу та людська автентичність: чи здатен ШІ імітувати емоції

Синтезатори мовлення на основі штучного інтелекту нині можуть вести реалістичні розмови: розставляти акценти, шепотіти та навіть "клонувати" голоси інших людей. LIGA.Life розбирається разом з експертом, що допомагає відрізнити штучний інтелект від людського голосу під час телефонної розмови, як саме ШІ аналізує голос людини, а також як розпізнати, що це не справжній співрозмовник.

Чат-боти працюють на основі великих мовних моделей, щоб відповідати та спілкуватися набагато природніше та переконливіше. Наприклад, голосова функція ChatGPT нині може відповідати, використовуючи варіації тону та наголос на певних словах у схожий спосіб, яким людина передала б співчуття та емоції. ШІ також може вловлювати невербальні сигнали, такі як зітхання та ридання, розмовляти 50 мовами та здатний передавати акценти. Штучний інтелект навіть може телефонувати від імені користувачів, щоб допомогти із завданнями — наприклад, під час однієї демонстрації система OpenAI замовила полуницю у продавця. Про це пише BBC. У деяких випадках ця технологія використовується для шахрайства, щоб змусити людей передати гроші злочинцям.

Крім цього, нещодавно голос Девіда Аттенборо, телеведучого-натураліста та кінопродюсера, "клонували" у телепрограмі. BBC News опублікували матеріал, використовуючи озвучування з останнього серіалу BBC Аттенборо "Азія". У ролику він каже: "Якщо ви думаєте, що бачили найкраще, що може запропонувати світ природи, подумайте ще раз. Більше ніде на Землі немає стільки нерозказаних історій. Тоді ласкаво просимо до Азії". BBC показало той самий відеоролик і запитало глядачів, чи чують вони якісь відмінності. Як результат: вони звучали майже однаково, але другий був створений штучним інтелектом за допомогою перехоплення інтонацій. ШІ-голос використовується в новинах на каналах YouTube, таких як The Intellectualist, для озвучування матеріалів про війну Росії проти України та новин про Дональда Трампа.

Це не перший схожий випадок. ШІ був одним із найактуальніших питань під час страйків сценаристів та акторів. А на початку цього року голос OpenAI під назвою Sky був вилучений після запуску, через те що акторка Скарлетт Йоганссон заявила про схожість з її голосом. Вона оприлюднила заяву, що засновник OpenAI Сем Альтман звернувся до неї за дозволом використання її голосу, і компанія просунулася з планом, попри те що акторка відхилила пропозицію. Скарлетт Йоганссон додала, що голос був видалений компанією, лише коли виникла загроза судового позову.

Як створити правдоподібний діалог між ШІ та людиною

Для створення справжнього правдоподібного діалогу потрібні значні інвестиції у розробку технологій та адаптацію до кожної мови, пояснює LIGA.Life Олексій Скрипка, засновник компанії EVE.calls, що створила голосового чат-робота. Особливо складно досягти природності у довільних темах розмови. Найкращий результат досягається у вузькоспеціалізованих сценаріях, де боти можуть використовувати чітко обмежену базу знань та мати предзаписані та озвучені сценарії.

Синтезатори голосу та людська автентичність: чи здатен ШІ імітувати емоції — Фото: Freepik

Експерт зазначає, що у бізнесі, залежно від потреб, використовують два підходи:

Читай повний матеріал з підпискою LIGA PRO

Вже маєте LIGA PRO? Авторизуйтесь

штучний інтелект ШІ

Якщо Ви помітили орфографічну помилку, виділіть її мишкою і натисніть Ctrl+Enter.

Сім років на передовій: як український бронеавтомобіль "Новатор" пройшов випробування боями

Спецпроєкт

Коментарі (0)

Щоб долучитись до дискусії, та активуйте підписку.

Синтезатори голосу та людська автентичність: чи здатен ШІ імітувати емоції

Як створити правдоподібний діалог між ШІ та людиною

Сім років на передовій: як український бронеавтомобіль "Новатор" пройшов випробування боями

Коментарі (0)

Ким працювати в епоху ШІ: які професії зростатимуть і з чого почати

Одне десятиліття життя виснажує найбільше: що кажуть дослідження

Авторка костюмів до "Конотопської відьми" створила вбрання для Leléka на Нацвідборі: деталі

Bad Bunny і його модний вибір на Супербоулі – костюм від Zara: що стоїть за стилем артиста

Дві-три чашки кави на день можуть знизити ризик деменції – але є важлива умова

План для Чечні, Підробіток на $13 млн, Криза турецького текстилю.

Прощавай, ядерне стримування: чому 2026 буде найнебезпечнішим за останні 40 років

Сім років на передовій: як український бронеавтомобіль "Новатор" пройшов випробування боями