- 1、本文档共25页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《语音信号处理》讲稿第8章.ppt
第8章 语音增强 本章主要讨论的问题: 1.语音增强基本概念 2.语音增强的原理和方法 1.语音增强基本概念 语音增强的一个主要目标:从含有噪声的语音信号中提取尽可能纯净的原始语音。 目前,语音识别系统大多是工作在安静(无噪声)的环境中,噪声环境对语音识别系统造成严重影响。因此,语音增强可以作为语音识别的预处理手段。 2.语音增强的原理和方法 语音增强方法有多种,大致分为三类: ①基于语音产生模型 如:线性滤波法、梳状滤波法、自相关法 ②基于语音模型和噪声模型 如:维纳滤波法、卡尔曼滤波法 ③基于噪声特性(短时谱估计) 如:频谱减法、自适应噪声抵消法 2.语音增强的原理和方法 ①基于语音产生模型 1)线性滤波法 主要利用了语音的产生模型(语音知识),也用到噪声的统计知识(即对于受加性稳态白噪声干扰的语音来说,语音的频谱可以根据语音的产生模型近似地用含噪语音来预测得到)。但这些知识都是一种近似。因此,在低信噪比,且噪声不是白噪声(如有色噪声)时,效果不理想。 2.语音增强的原理和方法 在线性滤波法中,噪声频谱用期望值来近似。在得到语音和噪声近似的频谱后,可得到滤波器,即 2.语音增强的原理和方法 2)梳状滤波法 它利用了语音的频谱特性,即谐波性(如元音、浊音)。 对谐波性语音信号产生较大干扰的是周期性噪声,这种周期性噪声可以用梳状滤波器予以抑制,采用数字信号处理方法来实现。 缺点:必须已知语音的基频;没有考虑到谐波被噪声干扰的情况;对辅音的增强不理想(辅音不一定存在谐波性)。 2.语音增强的原理和方法 梳状滤波器可在时域实现,表达式如下: 其中,L为基频周期;M为常数;x(n)是滤波器输入信号序列;y(n)为输出信号序列;Ck为系数,随信号周期而变化。输出信号y(n)是输入信号x(n)的延时加权和的平均值。当延时与周期一致时,这个平均过程将使周期性分量得到加强,而其他非周期性分量或与信号周期不同的其他周期性分量受到抑制或消除。 梳状滤波器也可以在频域实现。 梳状滤波法的原理图 2.语音增强的原理和方法 3)自相关法 利用语音时域波形特征,即利用语音信号相关性来滤除噪声,增强语音信号。在语音信号中,元音和浊音具有明显的周期性,其相关函数也具有周期性,而噪声一般无规则,其相关函数从R(0)开始很快衰减。因此,含噪语音的相关函数基本上就是噪声中语音的相关函数。 缺点:自相关信号校准较困难,滤波时信息的损伤较大;对辅音的增强不理想,因为辅音几乎不存在周期性;此外,在低信噪比时,语音信号相关性减弱,增强效果不理想。 2.语音增强的原理和方法 ②基于语音模型和噪声模型 1)维纳滤波法 假定线性滤波器的输入为有用信号和噪声之和,两者均为广义平稳过程且已知它们的二阶统计特性,他根据最小均方误差准则(滤波器的输入信号与需要信号之差的均方值为最小)求得最佳线性滤波器的参数。 2.语音增强的原理和方法 维纳滤波器的缺点:维纳滤波器要求输入过程广义平稳且输入过程的统计特性已知。一般情况下,语音是非平稳的。它没有完全利用语音的生成模型。因此,它不适合于非平稳噪声干扰下的语音增强。卡尔曼滤波器可以弥补上述两个缺陷。 2.语音增强的原理和方法 2)卡尔曼滤波法 卡尔曼滤波法建立在噪声模型和基于语音LPC生成模型基础上,假定噪声和语音都是一个由高斯白噪声驱动的、具有适当阶数p的自回归AR模型,弥补了维纳滤波器的上述两个缺陷。 2.语音增强的原理和方法 自回归AR模型是一种全极点模型,即 式中,p为阶数,ak为LPC系数。因此,由H(z)=1/A(z)可构成全极点滤波器。 2.语音增强的原理和方法 设语音为s(n),则有 其中,u(n)为激励源,g为增益因子。 当s(n)为清音时,u(n)为宽带噪声;当s(n)为浊音时,u(n)为间隔为基音周期T的脉冲串。 当不存在背景噪声时,由序列s(n)求各声道参数ak的过程,即是典型的线性预测(LPC)分析。 2.语音增强的原理和方法 在卡尔曼滤波器中,语音s(n)和噪声n(n)分别假定为p阶和q阶的AR模型如下: 其中,?(n)、?(n)是零均值、方差分别为?2?、?2? 的高斯白色序列。 被加性噪声污染的含噪声语音信号x(n)可描述为 x(n)= s(n) + n(n) 纯净语音信号s(n)是不可接近的,只能从唯一可测量的信号x(n)中估计出其最佳值s^(n)。 2.语音增强的原理和方法
您可能关注的文档
最近下载
- 中国机动车驾驶证英文版模板.pdf
- 浙江中宁硅业有限公司10kt_a高纯一氧化二氮精馏提纯项目环境影响报告表.docx VIP
- 1 《伐檀》公开课一等奖创新教学设计-【中职专用】高一语文(高教版2023-2024基础模块上册).docx VIP
- GB8814-2017型材标准.docx
- 低代码开发师(中级)考试题库.docx VIP
- 埃斯顿Helm吨位仪监视系统—RLG系列说明.pdf
- 人教版(B版2019课标)高中数学选择性必修一2.7.1抛物线的标准方程 学案.docx
- 多维品质管理工具在医院精细化管理中的应用.docx VIP
- 汽车修理工安全操作规程.pptx VIP
- 新高考一轮复习数学全套课件.pptx VIP
文档评论(0)