OpenAI представила інструмент, який може озвучити текст голосом будь-якої людини
- Автор:
- Олександра Амру
- Дата:
Компанія OpenAI представила новий інструмент на основі штучного інтелекту — Voice Engine. Він може емоційно, акцентно й доволі реалістично озвучувати тексти голосом будь-якої людини, маючи 15-секундний зразок звучання мови.
Voice Engine створювали близько двох років, але поки що публічного доступу до нього немає — розробники побоюються, що його можуть використовувати масово й недоброчесно, зокрема для створення діпфейків.
«Ми сподіваємося почати діалог про відповідальне застосування синтетичних голосів і про те, як суспільство може адаптуватися до цих нових можливостей. На основі цих обговорень і результатів тестів ми ухвалимо обґрунтоване рішення про те, чи варто і як саме розгортати цю технологію в масштабі», — зазначили в компанії.
ШІ-модель, з якою працює Voice Engine також лежить в основі функції «Читання вголос» чат-боту ChatGPT від компанії OpenAI.
Компанія бачить кілька шляхів застосування технології, зокрема надання допомоги тим, хто з якихось причин не може читати, а також дітям у навчанні, оскільки природне звучання набагато сприятливіше у навчанні, ніж роботизовані голоси.
Також OpenAI пропонує використовувати нову технологію для перекладу відео та подкастів. Розробники зазначають, що навіть у перекладі Voice Engine зберігає природний акцент мовця.
У компанії зазначають, що новий інструмент також може допомогти у відновленні голосу пацієнтам з раптовими або дегенеративними станами мовленнєвого апарату. Крім того, Voice Engine може дозволити німим людям спілкуватися, озвучуючи природньою мовою їхні текстові запити. Приклади застосування із семплами кількома мовами також представлені в блозі.