语音交互和文本搜索的本质区别 智能语音交互是什么意思


语音交互和文本搜索的本质区别 智能语音交互是什么意思

文章插图
智能语音即声音信息在人机间的交互模拟,为人工智能的核心技术之一,也是人工智能落地最早的技术之一 。1980s至今智能语音经历三个阶段发展,2016年开始进入落地期,智能语音助手、智能音箱相继落地 。
现在,智能语音的相关应用正向消费级和企业级两大方向爆发 。其中消费级包括 智慧生活场景、 智能家居场景和智能驾驶场景,近期总的发展空间将达到3000亿元 。
企业级应用包括智慧教育场景、智慧医疗场景和应用于电信/金融/电商等场景的智能呼叫/客服场景,值得一提的是,企业级场景近一年来收到疫情的加速催化,空间也即将达到千亿规模 。
本期的智能内参,我们推荐华西证券的报告《智能语音赛道:风口已至,全面开花》, 从消费级、企业级两大分支还原智能语音的发展格局 。
_原题为
《智能语音赛道:风口已至,全面开花》
作者:刘泽晶
一、智能语音:AI核心赛道智能语音是AI的重要入口,是AI三大核心基础技术之一( 机器视觉、智能语音和机器学习) 。
智能语音在AI技术中占据重要地位,就市场份额而言,2019年智能语音占据我国AI22%的份额,仅次于已经实现大规模商用的机器视觉 。
智能语音是人工智能行业重要细分市场
所以,什么是智能语音? 简单点说,智能语音即声音信息在人机间的交互 。
人类大脑皮层每天处理的信息中,声音信息占20%,是沟通最重要的纽带 。智能语音将声音转为文字供机器处理、在机器生成语言之后,用语音合成技术将文本语言转化为声波 。
智能语音的实现流程 & 各环节模拟机制
智能语音的发展始于上世纪八十年代,迄今已经历了三个阶段:
1980s-2010为起步期:语音识别开始从孤立词识别系统向大量词汇连续语音识别系统发展;
2011-2015为变革期:微软DNN(深度神经网络)的出现使识别错误率第一次大幅降低,降幅约90%,技术与产品开始大发展;
2016至今为落地期:机器语音识别准确率第一次达到人类水平,约95%,智能语音技术进入落地期,智能语音助手、智能音箱相继落地 。
但是,相比于机器视觉,智能语音的落地进程相对落后 。机器视觉企业在全球AI企业中占比40%、在国内占比46%;是国内外AI企业最集中的领域 。
主要有两方面原因,一方面其数据的体量、密度相对有限,另一方面其涉及的声学研究、模式识别研究、通用NLP研究及垂直场景的深度语义理解等还未完全成熟(尤其2016年以前),因此在交互体验、使用效果、场景优化等方面都仍有较大空间 。
全球AI企业应用技术方向分布
中国AI企业应用技术方向分布
但随着智能语音技术逐渐成熟,未来几年市场将维持高速增长 。
根据Gartner发布的2018年AI技术成熟度曲线,当前语音识别已经进入?实质生产高峰期,意味着语音识别技术已被广泛接受,规模化落地即将开始 。此外,像自然语言处理、虚拟助理等相关智能语音技术历经淘洗之后即将落入,泡沫化低谷期,商业模式越来越成熟,也将进一步推动智能语音的落地 。
根据ReportLinker的预测:到2024年全球智能语音市场规模将达到215亿美元,其中智慧医疗健康、智慧金融以及各类智能终端智能语音技术需求将成为主要的驱动因素 。
智能语音市场按客户类型可分为消费级市场( 2C 或 2B2C )和企业级市场(2B) 。
消费级应用, 立足于个人日常生活,主要包括了智慧生活、智能家居、智慧办公、智能驾驶等场景,本质上是智能语音技术(以语音助手为代表)对于各类终端的赋能,是AIoT大生态的重要构成 。


以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!

「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助: