- 1、本文档共36页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第一章
语音信号的时域及频域特征
1.语音信号的主要特点
1.1.语音信号带宽
语音信号的带宽约为5KHz,主要能量集中在低频段。
1.2.语音信号是典型的随机信号
1)人的每次发音过程都是一个随机过程。很难得到两次完
全相同的发音样本。
2)在信号处理中,通常假设语音信号是短时平稳的。例如,可以认为在语音的浊音段部分,语音的二阶矩统计量是平稳的
(在5~10mS内),即二阶矩平稳,或称为宽平稳。
1
2.语音信号的时域波形
语音信号的波形(shi4)
2
语音信号波形(shi4)的局部细节
3
2.1.语音时域信号特征
2.1.1.语音时域信号的特点
1)清音段:能量低,过零率高,波形特点有点像随机的噪
声。这部分信号常与语音的辅音段对应。
2)浊音段:能量高,过零率低,波形具有周期性特点。所
谓的短时平稳性质就是处于这个语音浊音(元音)段中。
3)过渡段:一般是指从辅音段向元音段信号变化之间的部
分。信号变化快,是语音信号处理中最复杂、困难的部分。
4
2.1.2.语音的短时能量、短时平均幅度和短时过零率
(1)短时能量:
(2)短时平均幅度:
(3)短时过零率:
其中
5
3.语音信号的短时谱特征
3.1.短时傅立叶谱分析
对于能量受限的时域信号f(t),它的傅立叶变换可以写成
以上这个傅立叶变换,在“宏观上”给出信号f(t)的频谱信息,但是却无法确定某个“局部”时间段频谱的确切信息。或者也可以说,我们不能通过观测局部的时域信号来了解整个f(t)的
频谱信息。为此我们引入了所谓的短时傅立叶谱分析技术。
6
有许多技术都可以用来完成信号的短时谱分析。最典型的
就是小波变换和我们现在常采用FFT短时谱分析技术。
傅立叶短时谱分析与窗的形状和位置有关(与时刻有关)。
假设窗函数为w(t),那么信号f(t)的短时傅立叶变换为
例如,如果选择窗的形式为一个高斯函数
7
由于
所以有
这说明可以被加窗后的短时谱
这正是我们所希望的性质。
所精确地分解。
8
对于时域离散信号x(n),短时傅立叶变换定义:
这里w(n)为窗函数。例如,常用的窗函数有
矩形窗:
汉明窗:
9
3.1.1.短时傅立叶变换的线性滤波实现形式
短时傅立叶变换可以用两种滤波器实现形式来解释。
实现形式一:
对信号x(n)进行调制,将频谱搬移到低端,然后用w(n)滤
波器进行滤波分析。
10
X,(e
X,(e
x(n)
w(n)
w(n)
e~iom
11
实现形式二:对具有低通性质的w(n)滤波器进行调制,得到
带通滤波器,用此带通滤波器对信号x(n)进行分析。
e,-jon
12
rHaFREOUENCY
rHa
FREOUENCY
3.2.语谱图:
横轴表示时间,纵轴表示频率,用灰度表示对应频谱分量
的信号强度。
重
重
S0o
Akaea
4000
2000
1000
u
4000
200,
1009:
益00》04006300Q204.0004Bh00A
TIME.(aed)
4000
E
M
多
3
Spetogpumeofthevowelwmnd
l120
3.3.浊音谱特征
3.3.1.浊音谱的谱线结构
谱线结构是与浊音信号中的周期信号密切相关的。具有与
基音及其谐波相对应的谱线。
3.3.2.浊音谱的共振峰结构
频谱包络中有几个凸起点,与声道的谐振频率相对应。这些凸起点称为共振峰(Formant)。其频率称为共振峰频率。按频率由低到高依次为第一共振峰、第二共振峰…。相应频率用
F1、F2、F3.….来表示。
14
展
展
tms*HDTP*A1mRttn4tt
N~r
mTeRt
浊音信号的傅立叶分析谱
15
3.3.3.元音三角形图
所谓的元音三角形图就是指不同元音的F1、F2共振峰频
率在平面图上的关系。
元音三危形
16
3.4.清音谱特征
清音的频谱无明显的规律,比较平坦。在语音识别中使用
统计模型的方法加以解决。
17
4.基音与四声
4.1.基音周期与基音频率
1)基音的周期就是声带振动的周期。基音周期的倒数就是
基音频率。
2)基音是与人的声带长度、质量等物理量有关。因此与人
的年龄、性别、情绪等生理状态有关。
[注意]:音高(Pitch)与基音的关系。音高是听觉量,基音是物理
量。正如冷热与温度的关系一样。
18
基音周期示意图
19
4.2.基音的检测
4.2.1.时域上的基音检测方法
(1)AMDF法:
定义平均幅度差函数
在这里
您可能关注的文档
- 碳边境调节机制条例(中文译文)-64页.docx
- 项目收并购管理流程.docx
- 研学旅行基地项目可行性研究报告.docx
- 异型桥梁不同长度的预制T梁模板调节组合安装施工.docx
- 幼儿舞蹈创编与技法考试试卷.docx
- 必威体育精装版2015某煤焦公司焦炉煤气制备LNG装置项目可行性研究报告.docx
- 必威体育精装版专业英语【土木工程(路桥方向)】(共75页).docx
- 【精品文档】560关于计算机专业汽车车辆租赁网络信息管理系统设计的毕业设计论文英文英语外文文献翻译成品资料:使用基于Web和SMS技术的在线租车系统(中英文双语对照).doc
- 毕业论文-论《笑傲江湖》中的悲剧意识.doc
- 不同食品原料的感官评价设计实验实验报告(1).doc
- DeepSeek培训课件入门宝典:第2册 开发实战篇 .pptx
- 全面认识全过程人民民主-2024春形势与政策课件.pptx
- 2024春形势与政策-全面认识全过程人民民主.pptx
- 2025年春季学期形势与政策第二讲-中国经济行稳致远讲稿.docx
- 2024春形势与政策-铸牢中华民族共同体意识课件.pdf
- 2024春形势与政策-走好新时代科技自立自强之路课件 (2).pptx
- 2024春形势与政策-走好新时代科技自立自强之路课件.pptx
- 形势与政策学习指导教学-整套课件.pdf
- 2023年春季形势与政策讲稿第三讲-开创高质量发展新局面.pdf
- DeepSeek培训课件-清华大学-DeepSeek模型本地部署与应用构建.pptx
文档评论(0)