语音信号处理实用教程.ppt

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

*动态规划基本步骤找出最优解的性质,并刻划其结构特征。递归地定义最优值。以自底向上的方式计算出最优值。根据计算最优值时得到的信息,构造最优解。13.3动态时间规整*动态时间规正法(DTW)的计算实例ck=(ik,jk)(ik,jk-1)(ik-1,jk)min21751516472452433482215119202326172216221618151912111516791713451011FEDCBA1234RTg(i-1,j)+d(i,j)g(i-1,j-1)+2d(i,j)g(i,j-1)+d(i,j){DTW算法(部分优化法)g(ck)=g(ik,jk)=g(i,j)=D(T,R)=g(I,J)/(I+J)*DTW方法的缺点DTW是用于与说话人有关(SpeakerDependent)的语音识别,使用者自行录音然后再以自己的声音來比对之前录好的语音资料。此方法比較适合同一位说话人的声音來进行比較,因此应用范围比较狭隘,譬如目前手机NameDialing等等。13.3动态时间规整*DTW的问题:运算量大;识别性能过分依赖于端点检测;太依赖于说话人的原来发音;不能对样本作动态训练;没有充分利用语音信号的时序动态特性;DTW适合于特定人基元较小的场合,多用于孤立词识别;13.3动态时间规整*矢量量化矢量量化VQVectorQuantization是将K个(K=2)样值形成一个K维空间中的一个矢量,然后对此矢量进行一次量化,只传输或存储矢量的地址.因此能大大地提高压缩比.矢量量化总是优于标量量化,这是因为矢量量化有效地利用了矢量中各分量间地四种相关性(线性依赖性,非线性依赖性,概率密度函数的形状和矢量维数)来去除多余度.矢量量化是标量量化的多维扩展.13.4有限状态矢量量化技术*矢量量化编解码框图13.4有限状态矢量量化技术采用LBG算法(此名取Linde,Buzo,.Gray三人名字的开头英文字母)*有限状态矢量量化(FSVQ)每个状态有一个编码器、解码器和码本(仍然采用LBG算法)FSVQ的最大特点是有一个状态转移函数;利用这个状态转移函数,根据上一次状态sn和上一次的编码结果jn,来确定下一个编码状态sn+1。这个系统在不增加比特率的情况下,可以利用过去的信息来选择合适的码本进行编码,因而其性能比一般的同维数的无记忆的矢量量化系统好得多,但是其存储量增加了。13.4有限状态矢量量化技术状态转移函数f(*,*)*有限状态矢量量化(FSVQ)FSVQ的设计方法仍然建立在LBG算法的基础上,具体可分为三步:①各初始码本的设计。②用训练序列来获得状态转移函数。③用迭代法逐步改进各码本的功能。*FSVQ与APVQ及一般VQ的性能比较矢量维数kFSVQAPVQSNR一般VQSNRSNR状态数K12.024.122.027.8327.475.239.0648.106.1410.95128.877.1512.25129.257.9预测矢量量化(APVQ)**隐Markov模型HMM语音是一随机过程,每次发音时,我们可以得到一个帧矢量序列(称为发现序列)X:X={x1,x2,…,xT}对同一词的不同发音,X的帧数T和xi都在变化。可以看作是该随机过程模型的多次实现。从语音产生过程来看,可以想象为声道沿不同位置转移时,每一位置产生一随机声学输出。可把各声道位置想象为各个状态Si,而发现序列可想象为在该状态的一个随机输出Xi。这样,语音的随机过程可看作由两个随机过程构成:状态转移的随机过程;输出的随机过程。13.4有限状态矢量量化技术*基于HMM的识别系统13.4有限状态矢量量化技术*语音识别技术面临的问题数据资源(年龄、性别、语言、方言、主题、情绪、地域……切分、标注体系)抗噪性能(背景噪声、信道噪声、干扰)协同发音(Co-articulation)口语现象(重复、顿措、语序颠倒……)说话人变异(口音、情绪、年龄……)听觉机理(音量、频率、抗噪、区分……)

文档评论(0)

139****1983 + 关注
实名认证
内容提供者

副教授、一级建造师持证人

一线教师。

领域认证该用户于2023年06月21日上传了副教授、一级建造师

1亿VIP精品文档

相关文档