Мимика и очки

И. Иванов

Большинство видеотехнологий распознавания беззвучных команд, поданных движением губ человека, несовершенно — строго ограничен набор мимических сообщений, которые может уяснить программное обеспечение камеры. Да и сам их источник должен находиться рядом с видеокамерой или носить ее, например, прикрепленной к своим очкам.

Часть этих недостатков устраняет технология, которую предложили исследователи Корнеллского университета. Под руководством профессора Жанг Чена (Cheng Zhang) они создали интерфейс, управляемую интеллектуальную систему, которая распознает до 31 беззвучной команды. Для обучения мимике владельца прибору под названием EchoSpeech (ЭхоРечь) достаточно всего нескольких минут. ИИ распознает сообщения в 95% случаев. Программное обеспечение легко установить на смартфон. Работа была представлена на гамбургской конференции, посвященной человеческому фактору в компьютерных системах.

Система не требует много энергии, так как работает не на видео, а на акустических датчиках. Фактически это звуковой радар, сонар, который зондирует лицо и по отраженным волнам восстанавливает его мимику. Небольшие, диаметром меньше сантиметра, излучатели звука и приемные микрофоны укреплены на дужках очков. Постоянное облучение лица звуковыми волнами профессор Жанг никак не комментирует.

Аудиоданные, с которыми работает система EchoSpeech, занимают много меньше места, чем видеоинформация. Их просто передавать на смартфон в режиме реального времени. Для этого нужен лишь радиоканал блютуз интерфейса. Систему можно использовать для коммуникации через смартфон в шумных местах. Она также сможет стать заменой компьютерной мыши или другой управляющей периферии.

Один из авторов, аспирант Жанг Руйдонг (Ruidong Zhang), отмечает, что EchoSpeech может служить источником сигнала синтезаторов речи для немых людей. И, как профессор Жанг, особо подчеркивает, насколько новая технология способствует приватности владельца и сохранности его личных данных.

Очевидно, дешевую и эффективную технологию легко воспроизвести массово и удобно встроить, например, в систему социального контроля. Дополнительное распознавание звуков речи потребует лишь небольшой модификации программного обеспечения.

Разные разности
Игры делают нас людьми
Игры — важнейший инструмент становления человека. А какие игры — старомодные или современные цифровые — наиболее благотворно влияют на детей? Ученые психологического факультета МГУ имени М.В. Ломоносова решили поискать ответ на эт...
Пишут, что...
…помидоры и томатный сок могут избавлять от кишечных бактерий, таких как сальмонелла… …прогулка на природе улучшает процессы исполнительного контроля в мозге помимо преимуществ, связанных с физическими упражнениями… …женский половой гормон эстра...
Пингвины во сне
Все мы знаем, как важен сон. В этом смысле очень тяжело молодым мамам. Первый месяц-два, когда детеныша надо кормить каждые три часа, о ночном сне можно забыть. И это тяжело, женщины знают. А как животные с этим справляются? Например — птицы? Би...
Долгожители обязаны вирусам
Почему при прочих равных условиях одни доживают до ста лет, а другие — нет? Исследователи из Копенгагенского университета решили поискать ответ на этот вопрос в кишечнике долгожителей, а точнее — в том гигантском сообществе бактерий, которы...