- 1、本文档共67页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[数学]语音信号处理PPT_第三章_语音信号分析
阅读讨论PPT
孔常青
P第三章:语音信号分析
概述
语音信号的数字化和预处理
语音信号的时域分析
语音信号的频域分析
语音信号的倒谱分析
语音信号的线性预测分析
语音信号的小波分析
3.1 概述
语音信号分析:
语音信号处理的前提和基础,只有分析出可表示语音
信号特征的参数,才有可能利用这些参数进行高效的语音
通信、语音合成和语音识别等处理。语音合成的音质好坏
和语音识别率的高低,也都取决于语音信号分析的准确性
和精确性。
语音信号分析在语音信号处理中具有举足轻重的地位。
分类:
参数性质
分析方法
时域分析
频域分析
倒谱域分析
模型分析方法
非模型分析方法
简单、计算量小、物理意义明确
感知特性较好,更为重要
依据语音信号产生的数学模型来分析和提取表征这些模型的特征参数
不进行模型化分析
短时分析技术:
贯穿于语音分析的整个过程;语音信号从整体来看其特征
及表征其本质特征的参数均是随时间而变化的,所以它是一
个非平衡态过程,不能用处理平衡信号的数字信号处理技术对
其进行分析处理。
但是在一个短时间范围内(一般认为在10-30ms的短时间内),
其特性基本保持不变即相对稳定,因而可以将其看作是一个准稳
态过程,即语音信号具有短时平稳性。
不论是分析怎么样的参数以及采用什么分析方法,在按帧进
行语音分析,提取语音参数之前,有一些经常使用的、共同的短
时分析技术必须预先进行,如语音信号的数字化、语音信号的端
点检测、预加重、加窗和分帧等,这些也是不可忽视的语音信号
析的关键技术。
3.2 数字化和预处理
语音信号的数字化一般包括放大及增益控制、反混叠滤波、
采样、A/D变换及编码(一般就是PCM码);如下图:
预处理一般包括预加重、加窗和分帧等。
分析和处理之前必须把要分析的要分析的语音信号部分从输
入信号中找出来,叫做语音信号的端点检测。
预滤波、采样、A/D转换
预滤波的目的有两个:
抑制输入信号各频域分量中频率超出fs/2的所有分量(fs为采样频率),以防止混叠干扰。
抑制50Hz的电源工频干扰。
这样,预滤波器必须是一个带通滤波器,设其上、下截
止频率分别是fH和fL:
则绝大多数语音编译码器有:
fH=3400Hz,fL=60-100Hz,fS=8kHz
预滤波、采样、A/D转换
语音信号经过预滤波和采样后,由A/D变换器变换为
二进制数字码。A/D变换中要对信号进行量化,量化不
可避免地会产生误差。量化后的信号值与原信号值之间
的差值称为量化误差,又称为量化噪声。若信号波形的
变化足够大,或量化间隔Δ足够小时,可以证明量化噪
声符合具有下列特征的统计模型:
①它是平稳的白噪声过程
②量化噪声与输入信号不相关
③量化噪声在量化间隔内均匀分布,即具有等概率密
度分布
预滤波、采样、A/D转换
若用σx2表示输入语音信号的方差,2Xmax表示信号的峰值,
B表示量化字长, σe2表示噪声序列的方差,可以证明量化
信噪比SNR(信号与量化噪声的功率比)为:
假设语音信号的幅度符合Laplacian分布,此时信号幅度超
过4σx的概率很小,只有0.35%,因而可取Xmax=4σx,则上
式表明量化器中的每bit字长对SNR的贡献为6dB。
A/D转换器分为线性和非线性转换器两类。
目前的线性A/D转换器绝大部分是12bits的(即每一个采样
脉冲转换为12位二进制数)。非线性A/D转换器则是8位的,
它与12位线性转换器等效。
预处理
由于语音信号的平均功率谱受声门激励和口鼻辐射影响,高频端大约在800Hz以上按6dB /倍频程跌落,要在预处理中进行预加重(Preemphasis)处理。
预加重目的:
提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱,以便于频谱分析或声道参数分析。
预加重可在语音信号数字化时在反混叠滤波器之前进行,不仅可以进行预加重,而且可以压缩吸纳后的动态范围,有效提高信噪比。
预加重一般在语音信号数字化之后,利用数字滤波器实现:
值接近1。
预处理
进行过预加重数字滤波处
理后,接下来就要进行加
窗分帧处理。一般每秒的
帧数约为33-100帧,视实
际情况而定。分帧虽然可
以采用连续分段的方法,
但一般要采用如图3-1所
示的交叠分段的方法,这
是为了使帧与帧之间平滑
过渡,保持其连续性。
前一帧和后一帧的交叠部
分称为帧移。帧移与帧长
的比值一般取为0-1/2。
预处理
分帧是用可移动的有限长度窗口进行加权的方法来实现的,
这就是用一定的窗函数ω(n)来乘s(n),从而形成加窗语音
信号sω(n)=s(n)* ω(n)。
在语音信号数字处理中常用的窗函数是矩形窗
文档评论(0)