- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
MATLAB应用专题实践课程设计-基于MATLAB的语音信号的时、频域分析汇
基于MATLAB的语音信号的时、频域分析
摘要:MATLAB 语言是一种数据分析和处理功能十分强大的计算机应用软件 ,它可以将声音文件变换为离散的数据文件 , 然后利用其强大的矩阵运算能力处理数据 ,如数字滤波 、傅里叶变换 、时域和频域分析 、声音回放等。
本课程设计通过PC机录制自己的,运用M进行仿真分析,画出采样后语音信号的时域波形和频谱图,1. 语音信号的采集 1
2. 语音信号的时、频域分析 2
2.1 语音信号的时域分析 2
2.1.1 语音信号的时域波形 2
2.1.2 短时平均能量分析 3
2.2 语音信号的频域分析 6
3. 数字滤波器的设计 7
3.1 滤波器的设计选择 7
3.2 IIR数字滤波器的设计 8
3.3 对含噪语音信号进行滤波 10
4. 心得体会 10
参考文献 11
附 录 12
1. 语音信号的采集
为了将原始模拟语音信号变为数字信号,必须经过采样和量化两个步骤,从而得到时间和幅度上均为离散的数字语音信号。取样是将时间上连续的语音信号离散化为一个样本序列。根据取样定理,当取样频率大于信号的两倍带宽时,取样过程不会丢失信息,且从取样信号中可以精确地重构原始信号波形。
经过预滤波和采样后,由A/D变换器变换为二进制数字码。这种防混叠滤波通常与模数转换器做在一个集成块内,因此目前来说,语音信号的数字化的质量还是有保证的。市面上购买到的普通声卡在这方面做的都很好,语音声波通过话筒输入到声卡后直接获得的是经过防混叠滤波、A/D变换、量化处理的离散的数字语音信号。
实际工作中,我们可以通过很多种方式录制语音信号,如手机、电脑、MP3、录音笔等,然后通过转换工具将音频格式转换为MATLAB可以识别的音频文件格式,这里的转换工具可以是千千静听或者其它的专用音频文件格式转换软件,可以获得任何我们想要的音频格式。本设计中我们利用windows自带的录音机录制语音文件,图1-1是基于PC机的语音信号录制过程,声卡可以完成语音波形的A/D转换,获得WAV文件,为后续的处理储备原材料。
声音
图1-1 基于PC机的语音信号录制过程
本设计分别在安静环境和噪杂环境下录制自己的一段语音,内容相同,均为“语音信号处理”,保存在MATLAB软件的工作目录下,分别命名为“xinhao.wav”和“zaosheng.wav”
2. 语音信号的时、频域分析
2.1 语音信号的时域分析
2.1.1 语音信号的时域波形
语音信号的时域分析就是分析和提取语音信号的时域参数。进行语音分析时,最先接触到并且也是最直观的是它的时域波形。语音信号本身就是时域信号,因而时域分析是最早使用,也是应用最广泛的一种分析方法,这种方法直接利用语音信号的时域波形。时域分析通常用于最基本的参数分析及应用,如语音的分割、预处理、大分类等。
这种分析方法的特点是:①表示语音信号比较直观、物理意义明确。②实现起来比较简单、运算量少。③可以得到语音的一些重要的参数。④只使用示波器等通用设备,使用较为简单等。
MATLAB数据采集箱中提供的进行wavread?:wavread?用于读取扩展名为“.wav”的声音文件。其调用形式为:?y?=?wavread?()?。其作用是读取wave?文件将读取的采样数据送到y?中。sound:音频信号是以向量的形式表示声音采样的。sound?函数用于将向量转换为声音其调用形式为:sound?(y?,fs)?作用是向扬声器送出向量y?中的音频信号(采样频率为fs)?。w(n)。
在语音信号数字处理中常用的窗函数是矩形窗和汉明窗等,它们的表达式如下(其中N为帧长):
矩形窗: (2-1)
汉明窗: (2-2)
这两种窗函数都有低通特性,通过分析这两种窗的频率响应幅度特性可以发现:矩形窗的主瓣宽度小,具有较高的频率分辨率,旁瓣峰值大,会导致泄漏现象;汉明窗的主瓣宽8*pi/N,旁瓣峰值低,可以有效的克服泄漏现象,具有更平滑的低通特性因此在语音频谱分析时常使用汉明窗,在计算短时能量和平均幅度时通常用矩形窗。
由于语音信号的能量随时间变化,清音和浊音之间的能量差别相当显著。因此对语音的短时能量进行分析,可以描述语音的这种特征变化情况。定义短时能量为: (2-3)
其中N为窗长特殊地,当时,可简化为: (2-4)
本课程设计中录制的语音信号在矩形窗长N=400时的短时能量如下图2-2所示:
图2-2 N=400时的短时能量
短时平均能量的主要用途如下:
① 可以作为区分清音和浊音的特征参数。实验结果表明浊音的能量明显高于清音。通过设置一个能量门限值,可以大致判定浊音变为清音或者清音变为浊音
您可能关注的文档
- Flexsim教程基础知识汇.ppt
- Fluke_DSP4300测试仪培训汇.ppt
- EVDO测试软件及测试方法介绍汇.ppt
- FonsWeaver系列设备基础培训新编汇.ppt
- FPGA课程设计实验报告汇.doc
- FPGA实验报告-交通灯控制器设计汇.doc
- FPGA课程设计报告-交叉路口交通信号灯微控器设计及FPGA功能验证汇.doc
- Fortigate-产品介绍与实验拓扑汇.ppt
- FS系列无芯中频感应炉系统维护手册汇.doc
- FTP服务及其配置汇.ppt
- 中国国家标准 GB/T 45390-2025动力锂电池生产设备通信接口要求.pdf
- 中国国家标准 GB/T 45393.2-2025信息技术 建筑信息模型(BIM)软件 第2部分:参数化模型.pdf
- GB/T 45393.2-2025信息技术 建筑信息模型(BIM)软件 第2部分:参数化模型.pdf
- 《GB/T 45393.2-2025信息技术 建筑信息模型(BIM)软件 第2部分:参数化模型》.pdf
- GB/T 10184-2025电站锅炉性能试验规程.pdf
- 海尔智家股份有限公司海外监管公告 - 海尔智家股份有限公司2024年度环境、社会及管治报告.pdf
- 上海复旦张江生物医药股份有限公司2024 环境、社会及管治报告.pdf
- 中国邮政储蓄银行股份有限公司中国邮政储蓄银行2024年可持续发展报告.pdf
- 豫园股份:2024年环境、社会及管治(ESG)报告.pdf
- 南京熊猫电子股份有限公司海外监管公告 - 2024年度环境、社会及治理(ESG)报告.pdf
文档评论(0)