В Вашингтоне научились распознавать речь людей в толпе

27.05.202427.05.2024 Ксения Алексеева наушники

Новая технология от инженеров из Вашингтонского университета получила название Target Speech Hearing. Она позволяет выделять конкретные голоса людей из окружающего шума. Ее возможности были продемонстрированы на наушниках с шумоподавлением и поддержкой искусственного интеллекта.

Система дает возможность пользователю «записать» голос нужного собеседника, просто посмотрев на него в течение нескольких секунд, а затем слушать его в наушниках даже на ходу.

Для использования Target Speech Hearing достаточно надеть наушники с микрофонами, нажать кнопку и направить взгляд на говорящего человека. Звуковые волны от его голоса достигнут микрофонов с обеих сторон гарнитуры одновременно, но с допустимой погрешностью в 16 градусов. Далее наушники передают этот сигнал на встроенный компьютер, где программное обеспечение обучается распознавать голос выбранного собеседника и продолжает воспроизводить его в реальном времени.

В ходе испытаний системы 21 участник оценивал четкость воспроизведения голоса. Однако пока Target Speech Hearing может регистрировать только одного говорящего и только в том случае, если другой громкий голос не доносится с той же стороны.

Новая технология недоступна для продажи. Однако, как отмечают разработчики, она в будущем сможет найти применение в создании слуховых аппаратов нового поколения, а также инновационных наушников.

Фото: Вашингтонский университет