OpenAI представила інструмент, який може озвучити текст голосом будь-якої людини

Автор:
Олександра Амру
Дата:

Компанія OpenAI представила новий інструмент на основі штучного інтелекту — Voice Engine. Він може емоційно, акцентно й доволі реалістично озвучувати тексти голосом будь-якої людини, маючи 15-секундний зразок звучання мови.

Voice Engine створювали близько двох років, але поки що публічного доступу до нього немає — розробники побоюються, що його можуть використовувати масово й недоброчесно, зокрема для створення діпфейків.

«Ми сподіваємося почати діалог про відповідальне застосування синтетичних голосів і про те, як суспільство може адаптуватися до цих нових можливостей. На основі цих обговорень і результатів тестів ми ухвалимо обґрунтоване рішення про те, чи варто і як саме розгортати цю технологію в масштабі», — зазначили в компанії.

ШІ-модель, з якою працює Voice Engine також лежить в основі функції «Читання вголос» чат-боту ChatGPT від компанії OpenAI.

Компанія бачить кілька шляхів застосування технології, зокрема надання допомоги тим, хто з якихось причин не може читати, а також дітям у навчанні, оскільки природне звучання набагато сприятливіше у навчанні, ніж роботизовані голоси.

Також OpenAI пропонує використовувати нову технологію для перекладу відео та подкастів. Розробники зазначають, що навіть у перекладі Voice Engine зберігає природний акцент мовця.

У компанії зазначають, що новий інструмент також може допомогти у відновленні голосу пацієнтам з раптовими або дегенеративними станами мовленнєвого апарату. Крім того, Voice Engine може дозволити німим людям спілкуватися, озвучуючи природньою мовою їхні текстові запити. Приклади застосування із семплами кількома мовами також представлені в блозі.