智能语音交互是基于语音输入的新一代交互模式,通过说话就可以得到反馈结果。可以理解为人类与机器间通过自然语言完成信息传递的技术。语音交互的完整流程,如下图所示。通常,根据距离远近语音交互场景可分为两种:近场语音场景:通常通过按键激活,例如智能手机等便携设备。远场语音场景:通常通过唤醒词激活,例如智能音箱等固定设备。远场语音场景下,在产品策略上通常会采取两种方案,以提高唤醒的准确率:将唤醒词的音节长度增加到 4 音节。这是因为音节越长,唤醒的准确率就会越高。比如:“小兴小兴”的唤醒准确率远高于“小兴”。白天只对唤醒词做本地校验,夜间则再增加云端二次校验。这是唤醒速度和准确率间的平衡策略。白天用户更看重响应速度,发生偶尔的误唤醒用户能理解或接受,这时候仅由本地的唤醒检测模块进行快速检测,保证 700 ms 内快速响应用户。晚上睡觉时用户对误唤醒是零容忍的,这时候就要偏重唤醒的准确度,将本地检测过的语音上传到云端进行二次确认,再决定本地
跟机器语音交互的时候到底发生了什么?
2022-12-05 18:34:05来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- TikTok 正开发 AI 语音克隆功能,只需 10 秒即可复制你的音色2024-04-20 18:48:23
- 云鲸发布逍遥 001 全智能清洁机器人:双目 AI 系统、内置 NarGPT 语音助手,4999 元起2024-04-19 16:48:18
- 无需语音唤醒词,谷歌 Pixel 平板测试 Look and Sign 功能:可用手势交互2024-04-18 14:21:11
- 改进 Markdown 格式显示,华为鸿蒙全新小艺“智慧语音”App 获推 12.1.3.400 众测更新2024-04-15 17:49:41
- 微软 Azure 新增 9 款逼真 AI 语音,包括美式英语、中文等2024-03-31 07:24:25
- 15 秒语音片段就能合成某人声音,OpenAI 小规模开放 Voice Engine 模型2024-03-30 11:50:43
- 可“识别前车型号”,小米 SU7 车型内置全新小爱 AI 大模型智能语音2024-03-28 20:26:58
- 支持电影票预订商圈查询服务,华为鸿蒙全新小艺“智慧语音”App 获推 12.1.2.400 众测更新2024-03-22 21:44:53
- 百度地图联动《完蛋!我被美女包围了》DLC,角色语音包上新2024-03-09 11:10:47
- 众寻 V2 Elite AI 鼠标现身电信产品库:支持 PPT 生成、语音打字、实时翻译等功能2024-03-05 15:24:30
- 1Canalys:2024 年一季度华为重夺中国大陆智能手机市场第一
- 2特斯拉回击投资者对马斯克薪酬方案的反对意见
- 3创力集团等成立煤机智能装备公司 注册资本6000万
- 4依托于“天通一号”,比亚迪与中国电信联合推出汽车直连卫星业务
- 5用回iPhone 5c后,我怀念起那个把塑料做出高端感的时代
- 6安踏0碳使命店开幕;VICUTU威可多30周年品牌升级首倡“正装全场景”;太平鸟品牌VI升级;方里官宣梅耶·马斯克|消…
- 7两市融资余额减少5.65亿元
- 8射击游戏《逃离塔科夫》推出 The Unheard 版:专属 PvE 模式,250 美元
- 9全文|微软Q3业绩会实录:有信心将投资转化为未来的第二次成功
- 10微软放出 36 年前的 MS-DOS 4.0 版系统源代码