Yobe разработала систему VISPR для распознавания голоса в шумной обстановке

Компания Yobe представила систему Voice Identification System for user Profile Retrieval (VISPR), способную выделить голос пользователя даже в шумной обстановке. Технология, использующая искусственный интеллект, позволит использовать голосовое управление смартфоном на вечеринке, в толпе, на шумном мероприятии — там, где голос сложно распознать среди других звуков.

Принцип работы

Канал обработки сигнала адаптируется к окружающей обстановке: акустике комнаты, уровню шумов, количеству улавливаемых голосов. Обработчик сигнала анализирует звук с учётом свойств микрофона, что позволяет добиться лучшего результата. Искусственный интеллект разделяет звук на отдельные голоса и посторонние шумы.

Затем VISPR ищет в каждом из вычлененных голосов контрольные биометрические идентификаторы, уникальные для каждого человека.

Разработчики VISPR

Стартап Yobe, разработчик VISPR, был основан в MIT и получил поддержку венчурной компании Clique Capital Partners, а также грант Национального научного фонда SBIR. Всего было потрачено около двух миллионов долларов. Соучредитель и генеральный директор Yobe Кен Саттон считает VISPR более надёжной системой, чем представленные на рынке аналоги. Он заявляет, что VISPR повышает точность обработки речи до 85 процентов.

В октябре 2018 года компания Google представила свою систему вычленения голоса VoiceFilter. Разработчики обучили две отдельные нейросети: одна распознаёт говорящего, другая сравнивает звуковые спектрограммы.

Источник: tproger.ru