- 1、本文档共68页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章 语音信号的数字模型
(3)计算以下三个量 2.4 语音信号的非线性模型 “十二五”普通高等教育本科国家级规划教材 (2.26) (2.27) (2.28) 根据上面式子,我们寻找 的第一个零点,或根据 第一个极小值寻找时间延迟 ;寻找 最小值即为窗口延迟时间 ,由 得到嵌入维数 。 2.4 语音信号的非线性模型 “十二五”普通高等教育本科国家级规划教材 实验所用的语音样本是柏林语音库录制的语音的一小段语音,采样率为16kHz。使用disjoint()函数对时间序列进行分解,使用correlation_integra()函数计算关联积分,使用reconstitution()函数进行相空间的重构。 2.4 语音信号的非线性模型 “十二五”普通高等教育本科国家级规划教材 4、非线性模型在语音信号处理中的应用及MATLAB实现 经过MATLAB进行仿真之后可以得到如图2-13所示的仿真结果。 2.4 语音信号的非线性模型 “十二五”普通高等教育本科国家级规划教材 (a) 一帧语音data相空间重构前后对比图 (b) 一帧语音data相空间参数仿真图 图2-13 相空间重构运行结果图 本章小结 重要概念:浊音、清音、爆破音 基音周期、基音频率、共振峰 临界带宽 重点掌握:(1)语音产生过程; (2)掩蔽效应 (3)语音信号的线性,模型 局限性以及解决办法。 (4)语音信号的非线性模型 “十二五”普通高等教育本科国家级规划教材 第二章 语音信号的数字模型 思考 1、简要解释语音的形成过程。 2、什么是听觉掩蔽效应?掩 蔽效应的存在对研究语音信号处理系统有什么启示? 3、理解语音信号产生的数字模型及模型组成。 “十二五”普通高等教育本科国家级规划教材 第二章 语音信号的数字模型 2.3 语音信号的 线性模型 “十二五”普通高等教育本科国家级规划教材 第二章 语音信号的数字模型 有三部分作用施加在语音的声波上: 语音信号的传递函数由这三个函数级联而成, 即: H(z)=G(z)V(z)R(z) (2.1) “十二五”普通高等教育本科国家级规划教材 2.3 语音信号的线性模型 2.3.1 激励模型 ? 发浊音时,产生的脉冲类似于斜三角形的脉冲。激励波是一个以基音周期为周期的斜三角脉冲串。 ? 图2.9 三角波及其频谱图 “十二五”普通高等教育本科国家级规划教材 2.3 语音信号的线性模型 单个三角波的数学表达式为 其中:N1为斜三角波的上升时间 N2为其下降时间 “十二五”普通高等教育本科国家级规划教材 (2.2) 2.3 语音信号的线性模型 单个斜三角波的频谱G(ejω)表现出一个低通滤波器的特性。其z变换的全极点形式为: 作为激励的斜三角波串可以用一串加了权的单位脉冲序列去激励单位斜三角波模型实现。这个单位脉冲串和幅值因子可以表示成下面的z变换形式 “十二五”普通高等教育本科国家级规划教材 (2.3) (2.4) 2.3 语音信号的线性模型 浊音激励模型可表示为 清音可以模拟成随机白噪声。 “十二五”普通高等教育本科国家级规划教材 (2.5) 2.3 语音信号的线性模型 典型的声道模型有两种:无损声管模型和共振峰模型。无损声管模型比较复杂,故本节只介绍共振峰模型。 共振峰模型: 当声波通过声道时,受到声腔共振的影响,在某些频率附近形成谐振。反映在信号频谱图上,在谐振频率处其谱线包络产生峰值,一般把它叫作共振峰。 2.3.2 声道模型 “十二五”普通高等教育本科国家级规划教材 2.3 语音信号的线性模型 “十二五”普通高等教育本科国家级规划教材 图2.10 语音信号的频谱 2.3 语音信号的线性模型 实践表明,用前三个共振峰代表一个元音足够了。多个Vi叠加可以得到声道的共振峰模型: 一个二阶谐振器的传输函数可以写成: “十二五”普通高等教育本科国家级规划教材 (2.6) (2.7) 2.3 语音信号的线性模型 图2.11 “我到北京去”的语谱图 “十二五”普通高等教育本科国家级规划教材 2.3 语音信号的线性模型 从声道模型输出的是速度波ul (n),而语音信号是声压波Pl(n)。二者倒比称为辐射阻抗Zl,它表征口唇的辐射效应。如果认为口唇张开的
文档评论(0)