Хочете знати, що кажуть тварини? Науковці теж! І вже навчають штучний інтелект розпізнавати «мови» тварин. Коли і як ми навчимося їх розуміти — переказуємо матеріал Financial Times

Автор:
Олександр М’ясищев
Редактор:
Дмитро Раєвський
Дата:
Хочете знати, що кажуть тварини? Науковці теж! І вже навчають штучний інтелект розпізнавати «мови» тварин. Коли і як ми навчимося їх розуміти — переказуємо матеріал Financial Times

Поліна Семенова / «Бабель»

Біологиня та етологиня Джойс Пул уже пів століття вивчає слонів. За цей час вона навчилась розрізняти типи звуків-повідомлень, які видають слони. Вона переконана: ці тварини здатні до складного спілкування і використовують низькочастотні звуки, щоб тримати звʼязок навіть за 10 км. Проте багато звуків наразі залишаються для Пул незрозумілими. Деякі важко розрізнити: вони накладаються один на одного або виходять за межі можливостей людського слуху. Дослідники сподіваються, що та сама технологія, яка працює в ChatGPT, дозволить людям зрозуміти «мови» тварин. Якщо все вийде, мікрофон і штучний інтелект стануть тим, чим колись став телескоп, каже професорка Карен Баккер. «Бабель» переказує великий матеріал Financial Times про те, як науковці намагаються вивчати комунікацію тварин і як ШІ розширює їхні можливості.

Тварини видають звуки, які ми не здатні почути. Тому повноцінно розуміти їх не вийде без чутливих мікрофонів. Люди можуть сприймати звуки з частотою від 20 Гц до 20 000 Гц. Проте багато звуків тварин — за межами діапазону людського слуху. Миші та кажани спілкуються на високих та ультразвукових частотах — аж до 100 тисяч Гц. А кити чи слони, навпаки, генерують тихі інфразвукові шуми — до -100 тисяч Гц.

Звуки видають і рослини, зокрема коли хворіють. Наприклад, звук, схожий на клацання, видають хворі помідори чи пшениця. Якби в майбутньому фермери могли «чути» хворі рослини, вони застосовували б отруйні пестициди точково, лише для частини врожаю.

Діапазони частот, на яких спілкуються слони, люди і кажани.

The Financial Times

Головна проблема таких досліджень — треба обробляти велетенські масиви даних. Саме тут у нагоді стане штучний інтелект. Він вже допомагає науковцям розбиратися в розмовах кашалотів. Дослідники Cetacean Translation Initiative вивчають кашалотів біля узбережжя Домінікани в Карибському морі. Останні спілкуються клацанням, схожим на азбуку Морзе, і навіть мають різні діалекти.

Але щоб аналізувати «розмови» кашалотів, недостатньо просто на якийсь час опускати у воду мікрофон. Морські біологи Шейн Геро та Девід Грубер робили це 20 років і кажуть: такі записи дають надто обмежене уявлення про спілкування тварин. Це те саме, як робити висновки про мову людей на основі аудіо зі стоматологічного кабінету. В такому випадку складеться хибне враження, що «кореневий канал» і «порожнина» — критично важливі для культури поняття.

Щоб розвʼязати цю проблему, дослідники почали безперервний аудіозапис. Для цього використовують мікрофони на буях, роботів-риб, повітряні дрони, а також мітки на спинах кашалотів. Це надає у 400 тисяч разів більше даних за рік, ніж старі методи. Але і проаналізувати таку кількість записів без ШІ неможливо.

Записи біологи надали команді Ceti, яка навчає ШІ розуміти кашалотів. Результати вразили. ШІ не просто розпізнає окремі репліки кашалотів, але і передбачає наступні — так само як смартфон передбачає наступні слова у реченні. Наприклад, якщо ШІ передати 20% записів, він передбачає вміст наступних 80%. І результати будуть на 95% правильними.

Також дослідники пробують спілкуватися з тваринами. Вони навчають штучний інтелект генерувати синтетичні звуки й дають тваринам їх слухати. Одного разу дослідники випадково увімкнули киту запис із його імʼям — і він засмутився.

Ще один проєкт, який може допомогти зрозуміти тварин, — Earth Species Project від розробника Ази Раскіна. Це проєкт на основі великої мовної моделі, як і ChatGPT, наприклад. Ідея моделі — семантичні звʼязки між словами у мові можна показати як геометричні звʼязки.

Раскін пояснює: уявіть, що мова — галактика, а кожне слово — зірка. Близькі за значенням слова у різних «галактиках», тобто мовах, розташовані на однаковій відстані. Наприклад, в усіх мовах слова «чоловік» і «король» між собою є так само близько, як і слова «жінка» і «королева». Тому можна перекладати з мови на мову, не знаючи значення слів, а лише розуміючи ці звʼязки між словами.

Аза Раскін вважає, що між тваринами та людьми є велика зона спільного досвіду. Наприклад, у відчутті любові, горя та радості. ШІ зможе розшифровувати мову тварин, якщо навчиться визначати зони, де наш досвід збігається. А такі зони є. Наприклад, у лемурів та дельфінів, як і в людей, є схильність вживати психоактивні речовини. Лемури навмисно кусають отруйних багатоніжок, щоб входити у стан трансу, а дельфіни змушують рибу-фугу надуватися і вживають отруту, яку вона виділяє.

Дослідники поки що не розвʼязали декілька ключових проблем. Найперше — багато звуків накладаються один на одного, коли «говорять» кілька тварин, і їх важко розділити. Проте Earth Species Project уже пробує розділяти запис із голосами кількох мавп на окремі голосові доріжки.

Також для ШІ потрібен величезний набір даних. Усіх наявних записів тварин поки недостатньо для комплексного навчання. Для прикладу, ChatGPT-3 навчали на основі мільярдів людських слів.

Недостатньо лише завантажити звуки тварин у програму. Хоча ШІ й може інтерпретувати спілкування тварин, проте й досі не зрозуміло, як саме це перекладати для людини. Професор зоології у Тель-Авівському університеті Йоссі Йовель пояснює, що люди мають обмежене сприйняття, а тварини — обмежені інструменти спілкування.

«Чи можна запитати у тварин, як вони почуваються сьогодні? Або що робили вчора? Якщо тварини не говорять про ці речі між собою, то й ми не зможемо з ними про це говорити», — каже Йовель.

Тварини спілкуються не тільки звуками. Багато з них використовують для передачі інформації запахи, електричні поля чи навіть сейсмічні хвилі. Але навіть якщо технологія зможе вловити ці дані, невідомо, як це інтерпретувати для людини. Професор Йовель каже, що ми можемо просто не знати, чому сваряться кажани, бо ми — люди. А усунути упередженість людської інтерпретації, на думку Йовеля, неможливо. Тому навряд чи розробники створять Google Translate для мов тварин.

Аза Раскін з Earth Species Project вважає, що є й інші шляхи. «Ймовірно, переклад не виглядатиме як Google Translate, де ви отримуєте конкретні слова. Можливо, він виглядатиме як спалахи кольорів і звуки. І ви будете радше відчувати, що [тварини] мають на увазі», — припускає він.

Ми — не кити, тому нашу мову перекласти просто. Фраза «щодня ми робимо для вас тексти на складні теми» означає «підтримайте нашу роботу»: 🔸 у гривні, 🔸 Buy Me a Coffee, 🔸 Patreon, 🔸 PayPal: [email protected].