- 1、本文档共26页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音信号处理MATLAB实验
目 录
实验一 语音信号预处理 1
实验二 基于语音短时时域分析的应用 2
一、端点检测 2
二、基音周期估计 6
实验三 语音信号频域特征分析 13
实验四 语音信号线性预测分析 17
实验五 谱减法语音增强方法研究 21
一阶FIR高通数字滤波器,a为预加重系数,0.9a1。
(5) 加噪声
(6) 对语音信号进行分帧处理
(7) 加窗
(8) 输出信号画图及存储方法(plot, subplot, axis ,xlabel, title, wavwrite)
(9) 画频谱图specgram(signal, 512, 16000, hamming(512), 256)
4. 实验结果实验二 基于语音短时时域分析的应用
一、端点检测
1. 实验目的
在理解语音信号短时能量和短时过零率的基础上掌握基于语音短时时域分析的端点检测方法。
2. 实验原理
在复杂的应用背景下,从信号流中分辨出语音信号和非语音信号,是语音处理的一个基本问题。端点检测就是指从包含语音的一段信号中确定出语音的起始点和结束点。准确的端点检测对于语音识别和语音编码系统都有重要的意义,它可以使采集的数据真正是语音信号的数据,从而减少数据量和运算量并将少处理时间。
判别语音段的起始点和终止点的问题主要归结为区别语音和噪声的问题。如果能够保证系统的输入信噪比很高,那么只要计算输入信号的短时能量就基本能够把语音段和噪声背景区别开来。但是,在实际应用中很难保证这么高的信噪比,仅仅根据能量来判断是比较粗糙的。因此,还需要进一步利用短时平均过零率进行判断,因为清音和噪声的短时平均过零率比背景噪声的平均过零率要高出好几倍,一般采用基音能量和过零率的语音端点检测方法——两级判决法。
A. 短时平均能量
由于语音信号的能量随时间变化,清音和浊音之间的能量差别相当显著。因此对语音的短时能量进行分析,可以描述语音的这种特征变化情况。定义短时能量为:
,其中N为窗长特殊地,当采用矩形窗时,可简化为:
短时能量函数的应用1)可用于区分清音段与浊音段。En值大对应于浊音段,En值小对应于清音段。2)可用于区分浊音变为清音或清音变为浊音的时间(根据En值的变化趋势)。3)对高信噪比的语音信号,也可以用来区分有无语音(语音信号的开始点或终止点)。无信号(或仅有噪声能量)时,En值很小,有语音信号时,能量显著增大。
过零率可以反映信号的频谱特性。当离散时间信号相邻两个样点的正负号相异时,我们称之为“过零”,即此时信号的时间波形穿过了零电平的横轴。统计单位时间内样点值改变符号的次数具可以得到平均过零率。定义短时平均过零率:
其中为符号函数,,在矩形窗条件下,可以简化为
短时过零率可以粗略估计语音的频谱特性。由语音的产生模型可知,发浊音时,声带振动,尽管声道有多个共振峰,但由于声门波引起了频谱的高频衰落,因此浊音能量集中于3K以下。而清音由于声带不振动,声道的某些部位阻塞气流产生类白噪声,多数能量集中在较高频率上。高频率对应着高过零率,低频率对应着低过零率,那么过零率与语音的清浊音就存在着对应关系。.
短时平均过零率的应用:1)区别清音和浊音。例如,清音的过零率高,浊音的过零率低。2)从背景噪声中找出语音信号。语音处理领域中的一个基本问题是,如何将一串连续的语音信号进行适当的分割,以确定每个单词语音的信号,亦即找出每个单词的开始和终止位置。3)在孤立词的语音识别中,可利用能量和过零作为有话无话的鉴别。
(4) 考察语音的平均能量设置一个较高的门限T1,用以确定语音开始,然后再根据背景噪声的平均能量确定一个稍低的门限T2,用以确定第一级中的语音结束点。,EN为噪声段能量的平均值。完成第一级判决。第二级判决同样根据背景噪声的平均过零率ZN,设置一个门限T3,用于判断语音前端的清音和后端的尾音。
3. 实验过程
(1) 通过Matlab仿真确定窗长,也就是帧长。(在kHz左右的采样频率下,N 选为1~480比较合适。
图1 不同矩形窗长的短时能量
图 不同hamming窗长的短时能量
图2.3 短时平均过零率
图2.4 利用能量和过零率进行两级判决后得到的端点检测波形图
二、基音周期估计
1. 实验目的
在掌握短时自相关函数和平均幅度差函数的基础上,掌握基音周期的检测方法,从而对基音周期有深入的了解。
2. 实验原理
人在发浊音时,气流通过声门使声带产生张驰振荡式振动,产生一股准周期脉冲气流,这一气流激励声道就产生浊音,又称有声语音,它携带着语音中的大部分能量。这种声带振动的频率称为基频,相应的周期就称为基音周期(Pitch),它由声带逐渐开启到面积最大(约占基音周期的50%)、逐渐关闭到完全闭合(约占基音周期的35%)、完
文档评论(0)