天籁|球场之外,他们用AI给这支特殊的「中国女足」造了一双「耳朵」( 三 )


在 3 月 3 日「全国爱耳日」之际 , 腾讯天籁又联合中国联通推出了这一应用的升级版 。
天籁|球场之外,他们用AI给这支特殊的「中国女足」造了一双「耳朵」
文章图片

升级版的发力点主要集中在辅听和字幕识别上 , 用肖玮的话说就是「对人的耳朵辅听 , 对机器也辅听」 。
对人的耳朵辅听很好理解 , 就是借助 AI 降噪算法让听损者在嘈杂环境下听得更清 。 对机器辅听则体现在实时字幕上 。 对此 , 肖玮举了一个生动的例子:「假设一个有听力障碍的大娘去买菜 。 因为现场说话很嘈杂 , 大娘很难跟菜农沟通 。 这个时候 , 大娘可以手持手机 , 手机安装了畅听王卡的 APP , 里面搭载了天籁音频 AI 降噪技术 。 菜农说活的声音被这个手机接收之后 , 大字就会横屏显示在手机上 , 从而帮助大娘更顺畅地交流 。 」
这些都是由腾讯天籁专门为听障用户打造的个性化 AI 语音增强辅听算法来支持的 , 它可以同时赋能语音通话和实时字幕双场景 , 实现典型噪音场景下单一字节言语识别率提升 66% , 实时字幕识别准确率提高了 5.5-9.9 个百分点 。
这种以软件为载体的辅听方式大大降低了听障患者使用辅听产品的成本 , 覆盖人群不仅限于听障者 , 还可以扩展到普通听损者 , 比如上了年纪的老年人 。 随着老龄化的加剧 , 这一人群的规模将持续扩大 。
不过 , 提到成本 , 腾讯天籁与美笛乐合作的「美讯听宝 APP」也是非常值得一提的 。
听障的治疗是一个漫长的过程 , 而且非常个性化 , 需要经历测听(类似配眼镜时的验光)、调机(把人工耳蜗调到最佳状态)等繁琐的过程 , 往往给听障家庭带来很大的经济压力 。
美讯听宝将测听、辅听、远程康复服务集中到了一个 APP 上 , 可以让听障人士不出家门就能随时掌握自身听力状态 , 并远程连线听力和康复专家接受会诊调机和康复指导服务 。 其特有的 AI 辅听功能还能让听损者借助一副蓝牙耳机听到更清晰的声音 。
「从成本上来说 , 美笛乐也给我们做了统计 , 平均每次可以节省 3000 人民币的费用 , 对一些用户来说 , 一年算下来的节省成本还是蛮可观的 。 」肖玮颇为欣慰地说到 。
天籁|球场之外,他们用AI给这支特殊的「中国女足」造了一双「耳朵」
文章图片

从技术研究到产业落地 , 再到在公益领域找到新的用武之地 , 商世东和肖玮都经历了一段不同寻常的职业生涯 。 在谈到所做的事情时 , 他们提到了同一个词——「成就感」 。 商世东甚至曾经说过 , 「过去所有工作带给我的成就感 , 都没有晓婷给我的这么大」 。
此外 , 商世东也提到了他们在打磨这些产品时遇到的一些挑战 , 比如辅听设备对延迟的严格要求 。
「我们在腾讯会议也要使用降噪技术 , 因为开会的两个人往往不是在同一个环境里面 , 对延迟的要求可以放宽到上百毫秒 。 但对于助听设备佩戴者来说 , 他和另一个对话者可能在同一个房间里面 , 间隔就几米 , 声音既可以直接传到对方耳朵里 , 也可以通过助听器降噪、放大、做完补偿以后再传过去 , 它对延迟的要求在 10 毫秒以下 。 这两者的技术挑战是不一样的 , 整个技术路线也是不一样的 。 」
「我们在这个过程当中做了很多的工作 , 把面向腾讯会议产品的降噪技术在一个低延迟、低功耗的限制下做到最好的体验 , 能够尽可能在延迟、功耗和效果上取得最好的平衡 , 实验室在这方面投入了很多的资源 , 包括人力资源、研究资源、经济资源与云上的资源 , 来训练、开发这样的模型 。 」商世东介绍说 。


以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!

「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助: