- 1、本文档共76页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
厦大MATLAB课件第3章.ppt
第三章 语音信号的短时时域分析 3.1 概述 语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中都需要提取语音中包含的各种信息。 语音处理的目的:对语音信号进行分析,提取特征参数,用于后续处理;加工语音信号。 总之,语音信号分析的目的就在于方便有效的提取并表示语音信号所携带的信息。 根据所分析的参数类型,语音信号分析可以分成时域分析和变换域(频域、倒谱域)分析。其中时域分析方法是最简单、最直观的方法,它直接对语音信号的时域波形进行分析,提取的特征参数主要有语音的短时能量和平均幅度、短时平均过零率、短时自相关函数和短时平均幅度差函数等。 3.2 语音信号的预处理 在对语音信号进行数字处理之前,首先要将模拟语音信号s(t) 离散化为s(n). 实际中获得数字语音的途径一般有两种,正式的和非正式的。 正式的是指大公司或语音研究机构发布的被大家认可的语音数据库,非正式的则是研究者个人用录音软件或硬件电路加麦克风随时随地录制的一些发音或语句。 语音信号的频率范围通常是300~3400Hz,一般情况下取采样率为8kHz即可。本书的数字语音处理对象为语音数据文件,是已经数字化了的语音。 有了语音数据文件后,对语音的预处理包括:预加重、加窗分帧等。 3.2.1 语音信号的预加重处理 预加重目的:为了对语音的高频部分进行加重,去除口唇辐射的影响,增加语音的高频分辨率。可通过一阶FIR高通数字滤波器来实现: 高通滤波器的幅频特性和相频特性如下 预加重前和预加重后的一段语音信号时域波形 预加重前和预加重后的一段语音信号频谱 3.2.2 语音信号的加窗处理 由于发音器官的惯性运动,可以认为在一小段时间里(一般为10ms~30ms)语音信号近似不变,即语音信号具有短时平稳性。这样,可以把语音信号分为一些短段(称为分析帧)来进行处理。 语音信号的分帧实现方法: 采用可移动的有限长度窗口进行加权的方法来实现的。一般每秒的帧数约为33~100帧。 分帧一般采用交叠分段的方法,这是为了使帧与帧之间平滑过渡,保持其连续性。前一帧和后一帧的交叠部分称为帧移,帧移与帧长的比值一般取为0~1/2。 图3.3给出了帧移与帧长示意图。 加窗常用的两种方法: 矩形窗,窗函数如下: 矩形窗及其频谱如下 汉明窗及其频谱如下 3.3 短时平均能量 1.短时平均能量定义 定义n时刻某语音信号的短时平均能量En为: 若令 则短时平均能量可以写成: 3.4 短时平均幅度函数 3.5 短时平均过零率 1. 定义 在离散时间语音信号情况下,如果相邻的采样具有不同的代数符号就称为发生了过零。单位时间内过零的次数就称为过零率。短时平均过零率的定义为 考虑到w(n-m)的非零值范围为n-m≥0,即m≤n,以及 n-m≤N-1,故m≥n-N+1,因此短时平均过零率可以改写为: 2. 实现短时平均过零率 3. 应用 清音过零率高,浊音过零率低。 局限性:浊音和清音重叠区域只根据短时平均过零率不可能明确地判别清、浊音。 端点检测 端点检测目的:从包含语音的一段信号中确定出语音的起点及结束点。 有效的端点检测不仅能使处理时间减到最少,而且能抑制无声段的噪声干扰,提高语音处理的质量。 3.6 短时自相关分析 自相关函数具有下述性质: (1)??? 对称性 R(k)= R(-k) (2)??? 在k = 0处为最大值,即对于所有k来说, |R(k)|≤R(0) (3)??? 对于确定信号,R(0)对应于能量 对于随机信号,R(0)对应于平均功率 3.6.2 语音信号的短时自相关函数 采用短时分析方法,定义语音信号短时自相关函数为 定义 (3-18) 那么短时自相关函数可以写成: 浊音的短时自相关函数 清
您可能关注的文档
- STL之父访谈录.pdf
- 职业技能实训(一)操作指导(学生版).ppt
- 图像分割-第1讲.ppt
- 商务英语翻译_第二节_涉外商务信函.ppt
- 有限元方法概论01绪论.ppt
- 中泰东邦科技影像系统.ppt
- 01制图基础.ppt
- 自动控制原理PPT课件.ppt
- 2科技英语翻译.ppt
- 精益生产中英文.ppt
- 2025贵州黔南州瓮安县天文镇招聘城镇公益性岗位人员1人笔试备考题库及答案解析.docx
- 2025河南商丘市夏邑县就业见习单位及就业见习人员招募笔试备考题库及答案解析.docx
- 2025福州市医疗保障基金中心招聘笔试备考试题及答案解析.docx
- 广东省恩平市事业单位考试职业能力倾向测验(医疗卫生类E类)强化训练题库推荐.docx
- 江西省樟树市事业单位考试(中小学教师类D类)职业能力倾向测验强化训练试题集附答案.docx
- 广东省四会市事业单位公开招聘考试职业能力倾向测验(D类)(中小学教师类)真题及答案1套.docx
- 浙江省义乌市事业单位考试(中小学教师类D类)职业能力倾向测验重点难点精练试题及答案1套.docx
- 浙江省奉化市事业单位考试(中小学教师类D类)职业能力倾向测验重点难点精练试题必威体育精装版.docx
- 江西省丰城市事业单位考试(自然科学专技类C类)职业能力倾向测验知识点试题推荐.docx
- 2025广东清远市清城区机关事务管理局招聘后勤服务类人员1人笔试备考题库及答案解析.docx
文档评论(0)