Фахівець з машинного навчання в університеті Карнегі-Меллона Рита Сінгх вимірює десятки характеристик людського голосу, таких як хрипота або тремтіння. Вона виділяє і мікрообʼєми повітря, які створюють звукові хвилі голосу. За її словами, те, як вони резонують у голосовому тракті, разом з іншими характеристиками, дозволяє зрозуміти структуру черепа, зріст, вагу або визначити, де людина перебуває — у приміщенні чи на вулиці. «Люди протягом століть знали, що голос несе інформацію, але не могли її виміряти. Тепер це можливо завдяки штучному інтелекту».
Дослідження Сінгх фінансує Департамент внутрішньої безпеки США. Деякі результати уже використовують, щоб скласти фоторобот підозрюваного. Правоохоронці розраховують, що в найближчому майбутньому для ідентифікації злоцинця чи його місцеперебування аудіозаписи будуть такими само корисними, як і відео.
У банківській сфері технології голосової біометрії використовуються для боротьби з шахраями уже кілька років. Ця інформація дозволяє перевірити особу того, хто дзвонить у службу підтримки, представляючись клієнтом банку.
Компанія із захисту інформації Pindrop аналізує дані 1 380 аудіопараметрів. Це допомагає визначити тип дзвінка — з мобільного чи стаціонарного телефону, або ж через інтернет. Особливо це корисно під час дзвінків з-за кордону. Таким чином банки отримують «голосові відбитки» тих, хто дзвонить, і позначають телефонних шахраїв.
Компанія Nuance Communications Inc. досліджує такі чинники людської мови, як тон, ритм, діалект, словниковий запас, граматику і структуру речень. Це допомагає розпізнавати стать, вік, рідну мову абонента, а також визначати, чи є голос синтетичним або записаним. За словами глави підрозділу з безпеки і біометрії Nuance Бретта Беранека, ця технологія допомогла одному банку викрити шахрая, який протягом року вкрав десятки мільйонів доларів.
Компанія Biocatch пропонує банкам комплексне рішення. Аудіодані дзвінків порівнюються з іншою біометричною та поведінковою інформацією про клієнтів. Наприклад, за тим, як людина тримає смартфон і з якою силою тисне на кнопки, можна визначити її вік.
Однак експерти з безпеки говорять і про ризики при зборі біометричних даних. Злам чи продаж такої бази даних набагато гірше за крадіжку номера банківського рахунку, картки або страховки, оскільки «фізичні особливості клієнта є вродженими і незмінними».
Технології голосової біометрії можуть стати в нагоді також у медицині. Останні дослідження показують, що зміни в голосі допомагають виявляти хворобу Паркінсона та розуміти, наскільки ефективним є лікування депресії.
Компанія Winterlight Labs Inc. аналізує такі особливості мови, як синтаксис, граматика, словниковий запас, тон і темп мовлення. Це може допомогти виявляти психічні розлади та деменцію. Winterlight спільно з Janssen Pharmaceuticals Inc. намагається аналізувати мову літніх пацієнтів, щоб діагностувати хворобу Альцгеймера. Наприклад, деякі з хворих використовують застарілі слова, оскільки їхні недавні спогади погіршуються.
Схожі дослідження з виявлення і лікування депресії проводить і компанія Sonde Health. Зараз вона вивчає особливості ритму, мелодики, швидкості та чіткості вимови чотирьох тисяч добровольців.