文章插图
这样的波形图对机器来说没有任何描述信息 。这个波形图背后是很多不同频率的波叠加产生的 。(准确的讲 , 它在时域上没有描述能力) 我们希望一段声纹能够给出一个人的特性 , 比如什么时候高 , 什么时候低 , 什么时候频率比较密集 , 什么时候比较平缓等等 。
文章插图
就是我们上面所说的 , 用傅里叶变化来完成时域到频域的转换 。这就需要对每一帧做傅里叶变化 , 用特征参数MFCC得到每一帧的频谱(这个过程就是特征提取 , 结果用多维向量表示) , 最后可以总结为一个频谱图(语谱图) 。如下图所示 , 是“hello”的频谱图 , 很酷是吧~横轴是时间 , 纵轴是频率 。颜色越亮 , 表示强度越大 。
文章插图
b)常用的特性参数 特性提取时 , 我们有常用的特征参数作为提取模板 , 主要有两种:
- 线性预测系数(LPC)
- 倒谱系数
文章插图
如上图所示 , 识别过程无非是:
- 把帧识别成状态(难点) 。
- 把状态组合成音素 。
以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!
「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助:- 健身前需了解的4大基础知识 1/2
- 新手必备6种花店经营模式 无基础开花店运营方案
- 要成功需要培养的五大素质 人生发展中3个基础的素质
- 手机无法识别usb设备怎么办
- 车牌识别系统设置
- u盘无法识别怎么办 u盘坏了无法识别怎么办
- 涂bb霜之前要涂什么步骤 做好基础的保湿工作
- 一个国家的什么决定这个国家的经济基础
- 人脸识别产品 人脸识别监控摄像头干嘛用
- 电工基础知识有哪些?电工专业基础知识