语音信号预处理方法研究.pdfVIP

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

一、设计目的与要求

本次课程设计的目的是利用MATLAB对语音信号进行数字信号处理和分析,

要求学生采集语音信号后,在MATLAB软件平台进行频谱分析和特征提取;并对

所采集的语音信号使用合适的滤波器滤除噪声,分析比较不同滤波器的性能。

要求利用MATLAB来读入(采集)语音信号,将它赋值给某一向量。再将该

向量看作一个普通的信号,对其进行FFT变换实现频谱分析,再依据实际情况对

它进行滤波。特征提取包括对原信号进行预加重处理,然后分帧并加窗,采样和

量化,端点检测等。然后我们还可以通过sound命令来对语音信号进行回放,以

便在听觉上来感受声音的变化。

-1-

二、设计方案论证

2.1设计理论依据

2.1.1采样定理

在进行模拟/数字信号的转换过程中,当采样频率fs.max大于信号中,最高

频率fmax的2倍时,即:fs.max=2fmax,则采样之后的数字信号完整地保留了

原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的5~10倍;

采样定理又称奈奎斯特定理。

1924年奈奎斯特(Nyquist)就推导出在理想低通信道的最高大码元传输速

率的公式:

理想低通信道的最高大码元传输速率=2W*log2N(其中W是理想低通信道

的带宽,N是电平强度)。

2.1.2采样频率

采样频率是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调,衡量

声卡、声音文件的质量标准。采样频率越高,即采样的间隔时间越短,则在单位时间内计算

机得到的声音样本数据就越多,对声音波形的表示也越精确。采样频率与声音频率之间有一

定的关系,根据奎斯特理论,只有采样频率高于声音信号最高频率的两倍时,才能把数字信

号表示的声音还原成为原来的声音。这就是说采样频率是衡量声卡采集、记录和还原声音文

件的质量标准。

2.1.3采样位数与采样频率

采样位数即采样值或取样值,用来衡量声音波动变化的参数,是指声卡在采

集和播放声音文件时所使用数字声音信号的二进制位数。采样频率是指录音设备

在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。

采样位数和采样率对于音频接口来说是最为重要的两个指标,也是选

择音频接口的两个重要标准。无论采样频率如何,理论上来说采样的位数

决定了音频数据最大的力度范围。每增加一个采样位数相当于力度范围增

加了6dB。采样位数越多则捕捉到的信号越精确。对于采样率来说你可以想

象它类似于一个照相机,44.1kHz意味着音频流进入计算机时计算机每秒会

对其拍照达441000次。显然采样率越高,计算机摄取的图片越多,对于原

始音频的还原也越加精确。

-2-

2.1.4预加重

通过一个一阶有限激励响应高通滤波器,使信号的频谱变得平坦,不

易受到有限字长效应的影响。

2.1.5分帧

根据语音的短时平稳特性,语音可以以帧为单位进行处理,实验中选

取的语音帧长为32ms,帧叠为16ms。Matlab中用函数:

y=enframe(x,framelength,step)进行分帧,每帧长framelength,分得的

帧数是nf=fix((nx-framelength+step)/step);其中nx是x的长度。y

是framelength×nf或nf×framelength的数组,取决于x是列数据还是

行数据。调用格式也可写为y=enframe(x,hanning(framelength),step);

这时每帧数据都乘了窗函数hanning(framelength)。

2.1.6加窗

采用汉明窗对一帧语音加窗,以减小吉布斯效应的影响。

2.1.7快速傅立叶变换(FastFourierTr

文档评论(0)

177****7755 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档