AI-наушники с чипом Apple M2 могут переводить речь нескольких говорящих
Университет Вашингтона представил инновационные AI-наушники, которые способны одновременно переводить речь нескольких спикеров. При этом они сохраняют голосовые особенности и направление звука в пространстве.
Устройство работает на чипе Apple M2. Оно использует бинауральный микрофон Sonic Presence SP15C и корпус от наушников Sony WH-1000XM4 для обработки аудио за 2-4 секунды.
Наушники определяют количество спикеров и их расположение, а также осуществляют перевод с испанского, немецкого или французского языков с высокой точностью. Все процессы происходят локально, что обеспечивает конфиденциальность данных пользователей. Технология поддерживает пространственный звук, создавая эффект присутствия и адаптируя громкость в зависимости от расстояния до говорящего.
Пока неясно, станут ли наушники коммерческим продуктом. Однако для разработчиков код проекта открыт, что может способствовать дальнейшему развитию технологии.
Фото: freepik




