Meta презентувала модель штучного інтелекту SeamlessM4T, яка може перекладати та транскрибувати близько 100 мов.
Про це пише TechCrunch.
У компанії заявили, що зібрали десятки мільярдів речень письмового тексту і 4 мільйони годин усного мовлення з інтернету. Точні джерела у Meta назвати відмовилися. Там стверджують, що отримані дані не були захищені авторським правом і надійшли переважно з відкритих або ліцензованих джерел.
Фахівці використали зібраний текст і мову для створення навчального набору даних для SeamlessM4T під назвою SeamlessAlign. Meta стверджує, що за результатами внутрішнього тесту вона показала кращі результати проти фонових шумів порівняно з поточною сучасною моделлю транскрипції мовлення.
Компанія також попередила, що їхній продукт може бути упередженим.
В офіційному документі Meta зазначила, що модель «надмірно узагальнює форми чоловічого роду при перекладі з нейтральних термінів» і працює краще при перекладі зі слів чоловічого роду для більшості мов.
- У травні стало відомо, що штучний інтелект Massively Multilingual Speech (MMS) від компанії Meta зможе розпізнавати більш ніж 4 тисячі мов і розмовлятиме понад 1 100 мовами. Компанія використала нетрадиційний підхід до збору аудіоданих — прослуховування аудіозаписів перекладених релігійних текстів.