- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于小波变换话说人语音特征参数研究
基于小波变换的说话人语音特征参数研究;摘要
说话人识别是利用说话人的语音特征对说话人的身份进行辨认或确认。在说话人识别系统中,最重要的是能够从语音片断中提取代表说话人独有特征的稳定参数。
针对短时傅立叶分析在提取说话人特征参数时的缺陷,本文通过对小波理论和说话人识别技术的研究,借鉴了一种传统的基于听觉机理的特征参数MFCC(Mel频域倒谱系数),利用小波变换、小波多分辨分析和小波包变换,构造出了两种基于小波变换的说话人识别特征参数:IWPTC(不完全小波包变换系数)和WPTC(小波包变换系数)。
;通过在Matlab平台上构建的说话人识别系统(包括文本有关和文本无关),验证了这两种参数的有效性:它们的识别率均高于MFCC参
数。理论和实验证明,利用小波变换提取的说话人识别特征参数相比于传统的短时分析方法确实具有更好的识别特性。
关键词:说话人识别 小波变换 MFCC参数;论文摘读;绪论部分;将原始信号分成10~30ms的短时帧,主要采用短时傅立叶变换的分析手段。由于短时傅立叶变换只具有单一分辨率的分析,所以本质上并不适合对语音信号这种非平稳时变信号的分析,用它提取的特征参数必是不完善的。
时频分布理论和小波理论的兴起为非平稳信号的分析和表示提供了新的手段,并已经在语音信号的分析和表示方面取得了一定的成功,有很大的发展潜力。小波变换采用多分辨分析的思想,非均匀的划分时频空间,在低频时有高的频率分辨率和低的时间分辨率,在高频时有低的频率分辨率和高的时间分辨率。这样对于频率成分复杂的语音信号,在服从不确定性原理的前提下,使;不同的时频区都可以获得比较合适的时一频分辨率。
目前,小波分析应用于端点检测、基音提取、语音编码等方面都有较成功的应用,但是对于说话人识别的特征参数提取方面涉及较少。用小波变换构造新的语音识别特征参数,不必受短时平稳假设的限制,所以作者希望借助于小波分析工具能够得到更高效的说话人识别特征参数。在这个过程中,作者借鉴了MFCC参数的提取过程,提取出了两种基于小波变换的特征参数:IWPTC(不完全小波包变换参数)、WPTC(小波包变换参数),在Matlab平台上进行了测试,结果表明,采用这两种参数的说话人识别系统的识别率均高于MFCC参数。
;第四章 基于小波变换的新参数(部分);MFCC就是基于听觉系统的临界带效应、在Mel标度频率域提取出来的一种倒谱参数。许多实验表明,大部分情况下,MFCC优于其它倒谱系数。;等诸多优点,可以弥补短时分析的缺憾,能够对信号进行更细致的分析。从理论上讲,凡是传统使用短时分析的地方,在语音信号处理中,都可以用小波分析来代替。目前,小波分析应用于端点检测、基音提取、语音编码等方面都有较成功的应用,但是对于说话人识别的特征参数提取方而涉及较少,所以作者希望借助于小波分析工具得到更高效的说话人识别特征参数。
2.参数的算法构思
如何将小波系数参数化一直是将小波变换用于识别的一个重要问题,所以很自然地想到可以借鉴短时傅立叶变换提取特征参数的做法,在此方面,最有效的语音参数就是MFCC了。提取MFCC时,对语音信号先作FFT变换进行频率分析,再通过一组三角滤波器进行滤波,这两个步骤可以用小波变换来取代,因为从滤波器的角度来看,对信号f(x)进行小波变换就相当于经过一系列高通和低通滤波器的滤波,从而得到信号在各个尺度的细节信息和剩余信息。在分析了倒谱及MFCC参数的提取过程后,发现可以从两个方面来尝试改进:
I.用小波变换代替短时傅立叶变换:;A.用离散小波变换代替傅立叶变换,其中采用的三角滤波器组不变,尝试由离散小波变换引出新参数;
B.由第四章可以看到,小波包分解可以对信号以二进制方式进行频率细分,从而达到提高频率分辨率的目的,其实从某种角度来说,小波变换的作用和滤波器类似,那么是否可以用小波包或者近似小波包分析信号代替三角滤波器组的滤波作用?
II.提取参数的最后阶段,实质上是使用分离器以分离滤波器组能量,MFCC采用的是DCT,那么小波变换是否是比DCT更好的分离器?某些资料曾经证明,在编码应用领域,使用小波变换取代DCT变换,分离效果更好。在说话人识别领域,是否也是这样呢?
III.如果去掉取对数和进行DCT变换而直接采用小波系数,是否可行?
基于以上想法,与MFCC参数的提取相比,经过筛选,构造了两种特征参数:
IWPTC(不完全小波包变换参数)和WPTC(小波包变换参数)。;结论(部分);2)提取参数的最后阶段——使用分离器分离滤波器组能量,本论文采用的是离散余弦变换,相信有更好的分离器,如果可以寻求到比离散余弦变换更好的分离器,预计也可以提高特征参数的识别质量;
3)在模板匹配的过程
您可能关注的文档
最近下载
- 汽车汽油甲醇双燃料系统加装及甲醇罐区甲醇加注站建设项目可行性研究报告可研报告.doc
- 科研管理人员招聘笔试题与参考答案(某大型央企).docx VIP
- 【小红书运营】小红书KOS(KEY OPINION SALES)产品手册.pdf
- 学前班数学《9的分解组成》课件.ppt VIP
- JCT2359-2016 预应力混凝土∕T型梁.docx VIP
- 新编秘书实务(第5版) 课件全套 葛红岩 第1--8章 秘书实务概述---参谋与信息调研工作.pptx
- 《新中国成立75周年》全文课件.ppt VIP
- 集体教育宿舍文明教育.pptx VIP
- 长库龄车辆话术引导.pptx
- “达丰现象”与中国塔机租赁业的自我救赎.pdf
文档评论(0)