Новини

Meta випустила модель штучного інтелекту, здатну перекладати близько сотні мов

Автор:: Анна Холоднова

Дата:: 11:20, 23 серпня 2023

Meta презентувала модель штучного інтелекту SeamlessM4T, яка може перекладати та транскрибувати близько 100 мов.

Про це пише TechCrunch.

У компанії заявили, що зібрали десятки мільярдів речень письмового тексту і 4 мільйони годин усного мовлення з інтернету. Точні джерела у Meta назвати відмовилися. Там стверджують, що отримані дані не були захищені авторським правом і надійшли переважно з відкритих або ліцензованих джерел.

Фахівці використали зібраний текст і мову для створення навчального набору даних для SeamlessM4T під назвою SeamlessAlign. Meta стверджує, що за результатами внутрішнього тесту вона показала кращі результати проти фонових шумів порівняно з поточною сучасною моделлю транскрипції мовлення.

Компанія також попередила, що їхній продукт може бути упередженим.

В офіційному документі Meta зазначила, що модель «надмірно узагальнює форми чоловічого роду при перекладі з нейтральних термінів» і працює краще при перекладі зі слів чоловічого роду для більшості мов.

У травні стало відомо, що штучний інтелект Massively Multilingual Speech (MMS) від компанії Meta зможе розпізнавати більш ніж 4 тисячі мов і розмовлятиме понад 1 100 мовами. Компанія використала нетрадиційний підхід до збору аудіоданих — прослуховування аудіозаписів перекладених релігійних текстів.