- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于小波包的语音特征提取新算法及其DSP实现
王靖琰1
(1. 中国科学院上海应用物理研究所,上海201800)
摘要:论文研究了小波包变换,分析了MFCC参数的提取,比较了MEL 滤波器组频带划分和小波包分解的频带划分,提出了基于小波包变换的特征参数(WPDC)。在此基础上,建立了一个矢量量化说话人识别系统。实验结果表明通过小波包变换提取的语音特征参数WPDC优于通过傅立叶变换提取的特征参数MFCC。最后在在浮点型DSP TMS320C6713B上实现了语音信号的WPDC提取。
关键词:说话人识别;MFCC;小波包;矢量量化;DSP
中国分类号:TH873.7 文献标识码:A
A New Speech Feature Extraction Algorithm Based on Wavelet Packet and Its Implement on DSP
Wang Jingyan1
??? (1.Shanghai Institute of Applied Physics, Chinese Academy of Sciences, Shanghai 201800, China)
Abstract: This paper studies wavelet packet transform and analyzes the extraction of MFCC parameters. Comparing partition of frequency-band between MEL filter group and wavelet packet decomposition, we extract a new parameter, WPDC, based on wavelet packet transform. A speaker recognition system is built based on this parameter. The experiment results indicate that the WPDC parameter is outperform MFCC.At last, this anthem is implemented on floating DSP TMS320C6713B.
Keywords: speaker recognition, MFCC, wavelet packet, VQ, DSP
0 引言Factual的关系可由公式(1)
表示:
MFCC 定义为语音信号经过快速傅里叶变换后所得的加窗短时信号的实倒谱。一般MFCC的计算过程如图1所示。
1.2 新特征参数WPDC的提取
现代小波变换被称为数学的显微镜[3],它通过有限个基函数在尺度-频率域上对信号进行分析,在控制分辨率的同时,保留了时域信息,因此在时变信号的处理上受到了极大关注。并且小波变换在各分析频段的恒Q(品质因数)特性与人耳听觉对信号的加工特点相一致,这一良好的特性为利用小波变换提取语音特征参数奠定了基础。
小波变换中的多分辨分析其最终目的是力求构造一个在频率上高度逼近L2(R) 空间的正交小波基,这些频率和分辨率不同的正交小波基相当于带宽各异的带通滤波器。小波包分析就是在多分辨分析的基础上,对高频信号部分进一步分解,这样根据被分析信号的特性,从而提取感兴趣频带的信息,为信号提供了一种更为精细的分析方法。
MFCC 参数提取过程是把信号的频谱通过一系列的带通滤波器,求得每个滤波器输出的对数能量,再进行DCT 变换得到的。从滤波器的角度看,小波包分析就是信号通过一系列不同频带范围的带通滤波器,从而获得信号在各频带内的信息。MEL 滤波器组与小波包分析的作用在某种意义上可以互换,一种很自然的想法就是用小波包分析来代替FFT 与MEL 滤波器组,然后再进行DCT 变换,从而得到一组新的语音特征参数WPDC(Wavelet Package DCT Coefficient)。
由于人耳对语音信号的感知是非线性的,MEL滤波器组在频带上的分布及带宽类似于临界频带的划分,这对选取小波包分析后的结点频带具有指导意义。因此,信号在经过小波包分析后,应选取出与MEL 滤波器组频带相一致的范围内的小波包系数。新的特征参数的提取计算可由图2表示。
笔者对语音信号的采样频率为8000Hz,即最高
语音频率约为4000Hz,根据临界带的划分与MEL滤波器组在频带上的分布,选取24个小波包分析结点频带进行6层小波包分解。小波包分解树中结点及其频带的选取如表1所示。
表1 小波包分解节点选取
小波包节点 频率范围/Hz 中心频率/Hz [6,0] 0~86 43 [6,1] 86~172 129 [6,2
您可能关注的文档
- “基于学校生活事件德育实效性研究”课题.doc
- 52Internet工作原理.ppt
- 95离子极化及其对键型和结构型式影响.ppt
- 122价格变动影响.doc
- 161实验:探究碰撞中不变量.doc
- 2010年高考历史试题分类汇编——世界资本主义经济政策调整.doc
- 2010年高考前思考.ppt
- HFC反向通道调整.doc
- Konqueror嵌入式浏览器分析及移植详解.doc
- OntoRBAC:基于本体RBAC策略描述和集成.ppt
- 第8课《世说新语二则》 统编版语文七年级上册.pptx
- 高一上学期9月+月考化学试题.docx
- 第12课《诗经二首》教学设计 统编版语文八年级下册.docx
- 第12课《醉翁亭记》同步练习 统编版语文九年级上册.docx
- 地理信息技术的应用+同步练 高中地理中图版(2019)必修一(共35张PPT).docx
- 风成地貌——风积地貌+课件+湘教版(2019)必修一 高一上学期.pptx
- 高三地理一轮复习《人类与地理环境的协调发展》训练卷.docx
- 中考语文作文专项复习:《应用文体写作》课件.pptx
- 第一章 物质及其变化 测试题 高一上学期化学人教版(2019)必修第一册+ (2).docx
- 定语从句课件 人教版英语九年级全册.pptx
最近下载
- 领导班子成员谈心谈话方案.docx VIP
- 2024年人教版五年级上册道德与法治精编知识点.doc
- 养成教育主题班会.ppt
- 通化(2009)1008-VI 时速200公里客货共线铁路隧道内接触悬挂安装图(单线双箱运输,绝缘锚段关节).pdf
- 工商管理大学课程设计民营企业职工培训管理.doc VIP
- 一种电力营销用智慧稽查数字化平台及系统.pdf VIP
- 矿建工程安全监理实施细则.doc
- 会计涉税分录.pdf VIP
- 贵州省黔东南苗族侗族自治州2023-2024学年九年级上学期期末历史试题(含解析).pdf VIP
- 九年级音乐上册第3单元演唱歌唱美丽的家乡全国公开课一等奖百校联赛微课赛课特等奖课件.ppt VIP
文档评论(0)