而在耳机端,大量的耳机依然使用的是触摸或者按键唤醒的方式来激活语音助手 。物理触摸或者点按的方式与语音激活,两者体验的差距当然是不言而喻的 。
Apple率先支持了语音唤醒,那么其他厂商是否能够跟上,又要如何实现 。又有哪些技术细节需要去考量?
首先TWS 耳机本地唤醒词的应用由语音辨识及误唤醒处理 2 个部份组成:
1、唤醒词语音辩识(本地语音命令亦同)
唤醒词辩识需由前端信号处理把用户声音与背景声音的信噪比拉高以利在不同应用场景让唤醒词识得到最高唤醒率,我们列出从麦克风采集到用户的声音信息数据开始,至唤醒词识别结束 。
依序完成唤醒词识别所需要的算法排列如下:
MIC→(LPSD 或 VAD)→(BF)→(NS 或 NR)→(KWD)
算法名称及参考供应商
LPSD 或 VAD,LPSD(Low Power Sound Detection),VAD(Voice Active Detection),参考供应商 DSPC,Seneory;
BF,BF(Beam Forming) 参考供应商 DSPC;
NS 或 NR,NS(Noise Suppression,Noise Reduction) 参考供应商 DSPC;
KWD,KWD(Key Word Detection) 参考供应商 Sensory,AI Speech,Nuance,Cyberon 。
眼下市场上真正能提供出足够算力,使用单一蓝牙芯片就能集成上述算法并低功耗做到本地唤醒词功能的有高通的:QCC512x 及 QCC302x 。
络达、瑞昱、恒玄等芯片产品建议搭配QuickLogic S3、Ambiq Apollo2、 Apollo3 或楼氏 IA-610、IA-611 智能麦克风芯片以达到在高算力低功耗要求下,满足本地唤醒词的功能 。
所有的算法或芯片都必须以合法的方式取得使用权力及各种必要技术支持,这些供应商内 Quicklogic 的 EOS S3 是最早与宇恒互动 OVVP 算法做全面系统整合应用于实际客户产品上的,S3 芯片内部还带有 891 个可编程的Logic Cell,设计非常独特,可以满足特殊硬件接口的需要 。
2、唤醒词或语音命令误唤醒误触发处理
误唤醒或误触发的定义:
TWS 耳机用户,非用户本人说出唤醒词或语音命令后,语音助手不回应或语音命令不动作,自己说出唤醒词后,却能唤醒或运行戴耳机用户的语音助手或语音命令 。
市场上几个不同方案的说明:
2-1、基本处理
一般在唤醒词算法群内,BF 可以起到一定减低误唤醒率的作用,但与声源的方向有关,在双麦克风的间隔距离够远,产品结构声学架构调试恰当状况下 DSPC 的 BF 算法可以做到3db~6db 。
这部份细节可以请教 DSPC 代理商聆感智能科技,他们有很专业的声学专家及实验室可以给需要的 TWS 耳机业者充分的声学相关设计服务 。
2-2、使用 vpu 骨传导传感器
参考HUAWEI华为 FreeBuds2 Pro 应用 vpu(Voice Peak Up) 。
vpu 严格说起来是使用一种 压电材料技术(因无法从datasheet内得知相关信息,只能从类似产品推论)的单轴加速度传感器(Voice Pick Up Sensor is a high performance accelerometer 引自Sonion Datasheet Description),主要是用来感测声带运动使用,是Sonion(声扬)公司的产品 。
以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!
「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助:- win10插了网线未识别的原因 win10没有本地连接怎么办
- word没有保存恢复方法 wps不小心没保存怎么恢复文件
- 游泳时不小心耳朵进水怎么办
- 游泳不慎耳朵进水如何处理
- 想离婚有没有很快的方法 怎么起诉离婚最快最简单
- 灭火器为什么用一次就没有压力
- ????:吴亦凡疑遭影视经纪公司抛弃上热搜 网友近汪峰没有新歌呀
- 银耳的做法大全家常菜 关于银耳的做法有什么
- 没有工具咖啡粉怎么泡
- 没有舞伴 一个人也可以跳好拉丁舞