Meta випустила модель штучного інтелекту, здатну перекладати близько сотні мов

Автор:
Анна Холоднова
Дата:

Meta презентувала модель штучного інтелекту SeamlessM4T, яка може перекладати та транскрибувати близько 100 мов.

Про це пише TechCrunch.

У компанії заявили, що зібрали десятки мільярдів речень письмового тексту і 4 мільйони годин усного мовлення з інтернету. Точні джерела у Meta назвати відмовилися. Там стверджують, що отримані дані не були захищені авторським правом і надійшли переважно з відкритих або ліцензованих джерел.

Фахівці використали зібраний текст і мову для створення навчального набору даних для SeamlessM4T під назвою SeamlessAlign. Meta стверджує, що за результатами внутрішнього тесту вона показала кращі результати проти фонових шумів порівняно з поточною сучасною моделлю транскрипції мовлення.

Компанія також попередила, що їхній продукт може бути упередженим.

В офіційному документі Meta зазначила, що модель «надмірно узагальнює форми чоловічого роду при перекладі з нейтральних термінів» і працює краще при перекладі зі слів чоловічого роду для більшості мов.