Штучний інтелект від Meta розпізнаватиме понад 4 тисячі мов. Його навчали на релігійних текстах

Автор:
Анна Холоднова
Дата:

Штучний інтелект Massively Multilingual Speech (MMS) від компанії Meta зможе розпізнавати більш ніж 4 тисячі мов і розмовлятиме понад 1 100 мовами.

Про це пише Engadget.

Meta надала відкритий доступ до MMS, щоб допомогти зберегти мовне розмаїття та заохотити дослідників розвивати його за допомогою свого інструменту.

Компанія використала нетрадиційний підхід до збору аудіоданих — прослуховування аудіозаписів перекладених релігійних текстів.

«Ми звернулися до релігійних текстів, таких як Біблія, які були перекладені багатьма мовами та чиї переклади були широко вивчені для дослідження мовного перекладу на основі тексту», — заявили в компанії.

На думку розробників, це важливий крок до збереження мов, яким загрожує зникнення.

  • У світі існує приблизно 7 000 мов, але існуючі моделі розпізнавання мовлення повністю охоплюють лише близько 100 з них. Це повʼязано з тим, що такі моделі зазвичай потребують величезних обсягів навчальних даних, які доступні лише для невеликої кількості мов.