基于小波包语音特征提取新算法及其DSP实现.docVIP

下载本文档

7
0
约5.96千字
约 7页
2017-09-10 发布于重庆
举报
版权申诉

基于小波包语音特征提取新算法及其DSP实现.doc

1、本文档共7页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于小波包的语音特征提取新算法及其DSP实现王靖琰1 （1. 中国科学院上海应用物理研究所，上海201800）摘要：论文研究了小波包变换，分析了MFCC参数的提取，比较了MEL 滤波器组频带划分和小波包分解的频带划分，提出了基于小波包变换的特征参数(WPDC)。在此基础上，建立了一个矢量量化说话人识别系统。实验结果表明通过小波包变换提取的语音特征参数WPDC优于通过傅立叶变换提取的特征参数MFCC。最后在在浮点型DSP TMS320C6713B上实现了语音信号的WPDC提取。关键词：说话人识别；MFCC；小波包；矢量量化；DSP 中国分类号：TH873.7 文献标识码：A A New Speech Feature Extraction Algorithm Based on Wavelet Packet and Its Implement on DSP Wang Jingyan1 ??? (1.Shanghai Institute of Applied Physics, Chinese Academy of Sciences, Shanghai 201800, China) Abstract: This paper studies wavelet packet transform and analyzes the extraction of MFCC parameters. Comparing partition of frequency-band between MEL filter group and wavelet packet decomposition, we extract a new parameter, WPDC, based on wavelet packet transform. A speaker recognition system is built based on this parameter. The experiment results indicate that the WPDC parameter is outperform MFCC.At last, this anthem is implemented on floating DSP TMS320C6713B. Keywords: speaker recognition, MFCC, wavelet packet, VQ, DSP 0 引言Factual的关系可由公式(1) 表示：　　 MFCC 定义为语音信号经过快速傅里叶变换后所得的加窗短时信号的实倒谱。一般MFCC的计算过程如图1所示。 1.2 新特征参数WPDC的提取现代小波变换被称为数学的显微镜[3]，它通过有限个基函数在尺度－频率域上对信号进行分析，在控制分辨率的同时，保留了时域信息，因此在时变信号的处理上受到了极大关注。并且小波变换在各分析频段的恒Q(品质因数)特性与人耳听觉对信号的加工特点相一致，这一良好的特性为利用小波变换提取语音特征参数奠定了基础。小波变换中的多分辨分析其最终目的是力求构造一个在频率上高度逼近L2(R) 空间的正交小波基，这些频率和分辨率不同的正交小波基相当于带宽各异的带通滤波器。小波包分析就是在多分辨分析的基础上，对高频信号部分进一步分解，这样根据被分析信号的特性，从而提取感兴趣频带的信息，为信号提供了一种更为精细的分析方法。 MFCC 参数提取过程是把信号的频谱通过一系列的带通滤波器，求得每个滤波器输出的对数能量，再进行DCT 变换得到的。从滤波器的角度看，小波包分析就是信号通过一系列不同频带范围的带通滤波器，从而获得信号在各频带内的信息。MEL 滤波器组与小波包分析的作用在某种意义上可以互换，一种很自然的想法就是用小波包分析来代替FFT 与MEL 滤波器组，然后再进行DCT 变换，从而得到一组新的语音特征参数WPDC(Wavelet Package DCT Coefficient)。由于人耳对语音信号的感知是非线性的，MEL滤波器组在频带上的分布及带宽类似于临界频带的划分，这对选取小波包分析后的结点频带具有指导意义。因此，信号在经过小波包分析后，应选取出与MEL 滤波器组频带相一致的范围内的小波包系数。新的特征参数的提取计算可由图2表示。　　笔者对语音信号的采样频率为8000Hz，即最高语音频率约为4000Hz，根据临界带的划分与MEL滤波器组在频带上的分布，选取24个小波包分析结点频带进行6层小波包分解。小波包分解树中结点及其频带的选取如表1所示。表1 小波包分解节点选取小波包节点频率范围/Hz 中心频率/Hz [6,0] 0～86 43 [6,1] 86～172 129 [6,2