科学家研发人工智能声呐眼镜：可识别唇语，准确率达 95%-微比恩

图片地址：https://img.ithome.com/newsuploadfiles/2023/4/6abc35ed-334e-4745-a506-b6c1d41d6047.jpg?x-bce-process=image/format,f_auto

IT之家 4 月 10 日消息，美国康奈尔大学的研究人员开发了一种新技术，可以通过声纳眼镜进行无声沟通。这种眼镜利用微型扬声器和麦克风来读取佩戴者默念的单词，从而可以在不需要物理输入的情况下执行各种任务。这项技术由康奈尔大学的博士生张瑞东（音译）领导开发，是在一个类似的项目的基础上进行的改进，该项目使用了一个无线耳机，而之前的模型则依赖于摄像头。据IT之家了解，该声纳眼镜使用一种名为 EchoSpeech 的无声语音识别接口，利用声纳来感知嘴部运动，同时使用一个深度学习算法实时分析回波特征。这使得系统能够以约 95% 的准确率识别佩戴者默念的单词。这项技术最令人兴奋的前景之一是，对于有语言障碍的人来说，可以使用它来无声地将对话输入到语音合成器中，然后将单词大声说出来。眼镜也可以用来在安静的图书馆中控制音乐播放，或者在嘈杂的音乐会上口述信息。该技术既小巧又低功耗，也不会侵犯隐私，因为没有数据离开用户的手机。这样，就不会有隐私方面的