Исследователи Корнеллского университета разработали новую технологию, позволяющую осуществлять бесшумную связь через очки-сонары . В очках используются крошечные микрофоны и динамики для чтения слов, которые молча произносит владелец, что позволяет им выполнять различные задачи без физического вмешательства.
Высокоточный дизайн
Очки спроектированы таким образом, чтобы быть ненавязчивыми и не требуют от пользователя смотреть в камеру или носить наушники. Вместо этого очки используют сонар для определения движений рта, а алгоритм глубокого обучения анализирует эхо-профили в режиме реального времени. Это позволяет системе достигать 95-процентной точности распознавания слов, которые пользователь произносит беззвучно.
Одна из самых захватывающих перспектив этой технологии заключается в том, что люди с нарушениями речи могут использовать ее для бесшумной передачи диалога в голосовой синтезатор, который затем будет произносить слова вслух. Очки также можно будет использовать для управления воспроизведением музыки в тихой библиотеке или для диктовки сообщения на громком концерте, где стандартные варианты не сработали бы.
Эта технология спроектирована так, чтобы быть незначительной, маломощной и чувствительной к конфиденциальности, при этом данные не покидают телефон пользователя. Таким образом, не должно быть проблем с конфиденциальностью. Очки также имеют форм-фактор, который устраняет необходимость смотреть в камеру или вставлять что-то в ухо. Так что это более практично и осуществимо, чем другие доступные технологии распознавания тихой речи.
По словам Ченга Чжана, доцента кафедры информатики Корнелльского университета: «Большинство технологий распознавания немой речи ограничиваются избранным набором предопределенных команд и требуют, чтобы пользователь смотрел в камеру или носил ее, что непрактично и невыполнимо.
Исследователи говорят, что системе требуется всего несколько минут обучающих данных, чтобы изучить модели речи пользователя. Когда устройство готово к работе, оно отправляет и принимает звуковые волны по лицу пользователя, воспринимая движения рта и используя алгоритм глубокого обучения для анализа профилей эха.
Текущая версия очков предлагает около 10 часов автономной работы для акустического восприятия и переносит обработку данных по беспроводной связи на смартфон пользователя, позволяя аксессуару оставаться маленьким и ненавязчивым.
В целом, гидроакустические очки, разработанные исследователями Корнельского университета, представляют собой значительный прорыв в технологии распознавания тихой речи. Обладая способностью распознавать широкий спектр слов и фраз, очки могут революционизировать то, как мы взаимодействуем с технологиями и друг с другом, будь то управление воспроизведением музыки, диктовка сообщений или помощь людям.
Будьте в курсе в удобном формате, присоединяйтесь: TG-канал и ВК
Бесплатная служба распространения новостей для научных организаций и стартапов
hello@technovery.com