- 1、本文档共57页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工学]ch3-part2频域分析
Matlab 命令:specgram Wideband spectrogram:给出共振峰频率 Narrowband spectrogram:基音周期及其谐波 §3.4.2 短时傅立叶变换的性质 THANKS N=1024 hamming window 幅度谱 N=2048 hamming window 幅度谱 欢迎使用微软中国研究院中文语音合成系统 的时域波形和语谱图 短时谱的卷积形式 语音信号x(m)的频谱 窗函数w(m)的频谱 窗函数w(n-m)的频谱 “毕业” 一、由 得出 当n=m时,且 绝对值 滤波器h(n) x(m) w(n-m) m n xn(m) 二.短时谱的卷积形式 语音信号x(m)的频谱 窗函数w(m)的频谱 窗函数w(n-m)的频谱 用 代替 为了使 能够与 具有相同的性质,则要求 是一个冲激函数 。窗长N越长, 的主瓣越狭窄尖锐,则 越逼近于 。但窗长N太大,窗选信号不满足语音的短时平稳特性, 不能正确反映短时语音的频谱了。为此,必须要合理选择窗长N。 三.短时功率谱和短时谱的关系 四.短时功率谱和短时自相关函数的关系 男声“深圳 广州 珠海”的短时功率谱统计。在采样频率为22050Hz的情况下,取20ms作为一帧,帧长为441点,一共统计了180帧。 短时功率谱 原始语音 (2). 利用短时功率谱的统计进行有声和无声的检测 含噪语音信号的短时功率谱统计,对每一帧输入信号,通过与预先设定的一系列门限值比较来判断该帧是信号帧还是噪声帧。 §3.4.3 短时傅立叶变换的线性滤波实现 一、 的另一种解释 当将 看成一个参变量, 就只是n的函数。 w(n) 短时频谱的线性滤波表示 w(n) w(n) 短时频谱的线性滤波实现 w(n) w(n)是窄带低通滤波器 假设 将x(n)的频谱向左搬移了 ,或等效将 频率上的频谱搬移到了零频率处。因此为使输出端有: w(n)是窄带低通滤波器 令 令 2.实数运算实现短时谱的线性滤波表示 窄带带通滤波器 + + + - 实数运算实现短时谱的线性滤波表示 §3.4.4 短时傅立叶变换的取样 时域取样 n 频域取样 一、时域取样 n(线性滤波实现) w(m) 带宽为B 带宽也为B 取样频率 由窗的主瓣宽度来决定。矩形窗为1,汉明窗为2。 二、频域取样 每帧 中语音信号个数为窗长N 三、时域和频域的总取样 当 时 的取样率和 的取样率之比: (过取样比) §3.4.5 语音的短时合成技术 离散短时傅立叶反变换 离散短时傅立叶变换 离散短时傅立叶反变换 在什么条件下由y(n)=x(n) 一、滤波器组相加法 窄带带通滤波器 假设 用带通滤波器组进行短时傅立叶分析 N个中心频率处于 的滤波器组成的滤波器组 * * * * * * * * * * * * * * * * Part 2 频域分析技术 §3.4.1 短时傅立叶变换的定义 §3.4.2 短时傅立叶变换的性质 §3.4.3 短时傅立叶变换的线性滤波实现 §3.4.4 短时傅立叶变换的取样 §3.4.5 语音的短时合成技术 §3.4.1 短时(加窗)傅立叶变换的定义 Short Time Fourier Transform-STFT 一、定义 两种解释: 1)n固定 FT 2) 固定 Linear Filter x(m) w(n-m) w(m) m m n 透过位于n处的窗口所观察到的语音短段的傅立叶变换。n取不同值时,窗w(n-m)沿时间轴滑到不同位置,取出不同的语音段,故 不仅是 的函数,还是时间n的函数。 短时幅度谱的计算过程 短时幅度谱得出的参数 二、移动窗形状对 的影响 元音[a]的短时幅度谱(n=512) rectangular window hamming window 从短时频谱图中可知:(1)快速变化,由激励信号引起的;(2)慢速变化,声道滤波器的共振峰特性引起的(3)采用汉明窗得到的短时频谱较矩形窗平滑,因而在语音分析中汉明窗用得较普遍。 hamming window Vowel /a:/ (a)50ms 包含6个周期,基音周期频率为120H
文档评论(0)