人工智能之语音识别技术 今天语音搜索了吗( 二 )


人工智能之语音识别技术 今天语音搜索了吗

文章插图

模式匹配?和语言处理
人工智能之语音识别技术 今天语音搜索了吗

文章插图

通过语音特征分析以后接下来就是模式匹配和语言处理声学模型是识别系统的底层模型,并且是语音识别系统中最关键的一部分 。声学模型的目的是提供一种有效的方法计算语音的特征矢量序列和每个发音模板之间的距离 。声学模型的设计和语言发音特点密切相关 。声学模型单元大小(字发音模型、半音节模型或音素模型)对语音训练数据量大小、系统识别率,以及灵活性有较大的影响 。必须根据不同语言的特点、识别系统词汇量的大小决定识别单元的大小 。语言模型对中、大词汇量的语音识别系统特别重要 。当分类发生错误时可以根据语言学模型、语法结构、语义学进行判断纠正,特别是一些同音字则必须通过上下文结构才能确定词义 。语言学理论包括语义结构、语法规则、语言的数学描述模型等有关方面 。目前比较成功的语言模型通常是采用统计语法的语言模型与基于规则语法结构命令语言模型 。语法结构可以限定不同词之间的相互连接关系,减少了识别系统的搜索空间,这有利于提高系统的识别 。语音识别过程实际上是一种认识过程 。就像人们听语音时,并不把语音和语言的语法结构、语义结构分开来,因为当语音发音模糊时人们可以用这些知识来指导对语言的理解过程,但是对机器来说,识别系统也要利用这些方面的知识,只是如何有效地描述这些语法和语义还有困难:
  • 小词汇量语音识别系统 。通常包括几十个词的语音识别系统 。
  • 中等词汇量的语音识别系统 。通常包括几百个词至上千个词的识别系统 。
  • 大词汇量语音识别系统 。通常包括几千至几万个词的语音识别系统 。这些不同的限
制也确定了语音识别系统的困难度 。模式匹配部是语音识别系统的关键组成部分,它一般采用“基于模式匹配方式的语音识别技术”或者采用“基于统计模型方式的语音识别技术” 。前者主要是指“动态时间规整(DTW法”,后者主要是指“隐马尔可夫(HMM)法” 。隐马尔可夫模型(HMM)是语音信号处理中的一种统计模型,是由Markov链演变来的,所以它是基于参数模型的统计识别方法 。由于其模式库是通过反复训练形成的与训练输出信号吻合概率最大的最佳模型参数而不是预先储存好的模式样本,且其识别过程中运用待识别语音序列与HMM参数之间的似然概率达到最大值所对应的最佳状态序列作为识别输出,因此是较理想的语音识别模型 。动态时间归整)算法:在孤立词语音识别中,最为简单有效的方法是采用DTW(Dynamic Time Warping,动态时间归整)算法,该算法基于动态规划(DP)的思想,解决了发音长短不一的模板匹配问题,是语音识别中出现较早、较为经典的一种算法,用于孤立词识别 。HMM算法在训练阶段需要提供大量的语音数据,通过反复计算才能得到模型参数,而DTW算法的训练中几乎不需要额外的计算 。所以在孤立词语音识别中,DTW算法仍然得到广泛的应用 。小结:语音识别在移动终端上的应用最为火热,语音对话机器人、智能音箱、语音助手、互动工具等层出不穷,许多互联网公司纷纷投入人力、物力和财力展开此方面的研究和应用 。语音识别技术也将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域 。尤其是在智能家居系统中语音识别将成为人工智能在家庭重要的入口,同时,未来随着手持设备的小型化,智能穿戴化也将成为语音识别技术的重要应用领域 。


以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!

「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助: