В Вашингтоне научились распознавать речь людей в толпе

Новая технология от инженеров из Вашингтонского университета получила название Target Speech Hearing. Она позволяет выделять конкретные голоса людей из окружающего шума. Ее возможности были продемонстрированы на наушниках с шумоподавлением и поддержкой искусственного интеллекта.

Система дает возможность пользователю «записать» голос нужного собеседника, просто посмотрев на него в течение нескольких секунд, а затем слушать его в наушниках даже на ходу.

Для использования Target Speech Hearing достаточно надеть наушники с микрофонами, нажать кнопку и направить взгляд на говорящего человека. Звуковые волны от его голоса достигнут микрофонов с обеих сторон гарнитуры одновременно, но с допустимой погрешностью в 16 градусов. Далее наушники передают этот сигнал на встроенный компьютер, где программное обеспечение обучается распознавать голос выбранного собеседника и продолжает воспроизводить его в реальном времени.

В ходе испытаний системы 21 участник оценивал четкость воспроизведения голоса. Однако пока Target Speech Hearing может регистрировать только одного говорящего и только в том случае, если другой громкий голос не доносится с той же стороны.

Новая технология недоступна для продажи. Однако, как отмечают разработчики, она в будущем сможет найти применение в создании слуховых аппаратов нового поколения, а также инновационных наушников.

Фото: Вашингтонский университет