模式识别句法方法.ppt

下载文档

0
0
约5.82千字
约 48页
2025-02-08 发布于广东
举报
版权申诉
保障服务

模式识别句法方法.ppt

1、本文档共48页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

语音信号的特征语音信号的产生冲激串发生器时变数字滤波器随机数发生器有声/无声开关语音信号声道参数幅度控制第27页,共48页，星期六，2024年，5月语音信号的特征基音周期指发浊音时声带振动所引起的准周期运动的时间间隔时域估计法：直接由语音波形来估计基音周期（自相关法、平均幅度差法）变换域估计法：将语音信号变换到频域来估计基音周期（倒谱法）第28页,共48页，星期六，2024年，5月语音信号的特征共振峰：汉语拼音七个韵母的共振峰频率(Hz)第29页,共48页，星期六，2024年，5月语音信号的特征频率特征第30页,共48页，星期六，2024年，5月语音信号的特征线性预测系数研究结果表明，声道对声源信号的影响可视为一全极点时变滤波器，其系统函数为：其中为时变参数第31页,共48页，星期六，2024年，5月语音信号的特征线性预测系数则语音信号合成的差分方程为：可见，是前p个语音信号采样值的线性组合，故称为线性预测（LP）模型或自回归（AR）模型称为线性预测系数第32页,共48页，星期六，2024年，5月语音信号的特征线性预测系数由于声道形状在时间上是变化的，故预测系数也是时变的。根据语音信号的短时平稳性，可以认为语音在一个分析帧（10-30ms）上是非时变的线性预测系数可从语音信号中提取出来第33页,共48页，星期六，2024年，5月语音信号的特征线性预测系数计算线性预测系数常用方法为自相关法基本思想是使预测误差的均方值最小计算的准则是使均方误差极小第34页,共48页，星期六，2024年，5月语音信号的特征令得到关于线性方程组第35页,共48页，星期六，2024年，5月语音信号的特征其中称为语音短时自相关函数，N为语音帧的样点数，p为预测器阶数。用Durbin算法可解上述方程组。第36页,共48页，星期六，2024年，5月语音信号的特征线性预测倒谱系数（LPCC）美尔频率倒谱系数（MFCC）第37页,共48页，星期六，2024年，5月语音识别模型在训练阶段，采用合适的模型来表征语音特征参数常用模型包括：模板匹配模型概率统计生成模型（参数模型）神经网络模型融合模型第38页,共48页，星期六，2024年，5月语音识别模型模板匹配模型（模板匹配法）从每类模式的训练语句中提取相应的特征向量，并以此为模板识别时，从语音信号中按同样的处理方法提取测试模板通过对参考模板的比较确定待识样本的类别最近邻模型（NN）、动态时间规整（DTW）模型、矢量量化（VQ）模型第39页,共48页，星期六，2024年，5月语音识别模型动态时间规整模型（DTW）是模板匹配模型的典型应用解决匹配时音长不一致问题线性匹配与非线性匹配第40页,共48页，星期六，2024年，5月语音识别模型动态时间规整模型（DTW）待测模式T参考模式Rttttt直接匹配D1(T,R)线性匹配D2(T,R)非线性匹配D3(T,R)第41页,共48页，星期六，2024年，5月语音识别模型动态时间规整模型（DTW）词汇表：W(n),n=1,2,…,N参考模式：R(k),k=1,2,…,N待识模式：T利用DTW算法，计算所有Dk(T,R(k))对所有Dk(T,R(k))求其最小值，该最小失真度所对应的下标n就为识别结果。n=argmin{Dk}第42页,共48页，星期六，2024年，5月语音识别模型矢量量化模型语音序列经加窗处理，成为若干短时段的时间序列，再进行特征提取（如LPC），就得到表征语音的特征向量为了提高运算速度和节约存储空间，必须对大量的训练向量进行压缩矢量量化将大量的特征向量用码字数较少的码本来表示第43页,共48页，星期六，2024年，5月语音识别模型矢量量化模型训练时通过对语音帧向量进行聚类生成指定向量个数的码本（参考模板的集合）识别时对待识样本进行矢量量化，以量化产生的失真度作为判决标准第44页,共48页，星期六，2024年，5月语音识别模型矢量量化模型第45页,共48页，星期六，2024年，5月语音识别模型隐马尔科夫模型（HMM）把语音建模成由可观察到的符号序列组成的随机过程隐马尔科夫