网站大量收购闲置独家精品文档,联系QQ:2885784924

语音信号处理第13章.ppt

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音信号处理第13章

13.5.2 耳语音的说话人识别 徐柏龄等人设计了说话人识别系统框图。系统主要分为预处理、特征提取、建模与模型匹配3个部分。其中预处理主要是对耳语音进行端点检测、语音增强、高通滤波(500Hz)和谱相减降噪。提取的特征矢量为20阶传统MFCC参数、MFCCM和MFCCExp-Log及其各自的一阶差分系数(△)。模型则采用的是标准隐马尔可夫模型和改进隐马尔可夫模型。 实验中采用的样本库由20个人(10男10女)的汉语耳语音数字(0-9)构成,每人将十个数字依次读10遍,合计2000音。用400个音进行训练,1600个音用于识别,识别结果见表 92.31% 90.13% MFCCExp-Log+ MFCCM(改进HMM) 91.37% 90.50% MFCCExp-Log+△(标准HMM) 88.88% 87.94% MFCCM+△(标准HMM) 88.25% 85.12% MFCC+△(标准HMM) 500-4000 0-4000Hz 起止频率 特征参量与模型 从结果可以看出采用MFCCM 和MFCCExp-Log参数的说话人识别系统的效能都优于采用传统的MFCC 参数的系统。 而且采用MFCCExp-Log的优势尤为明显,这是由于考虑到人耳敏感区域的偏移,与实际情况最为吻合。采用MFCCM 的结果虽然没有MFCCExp-Log的效果好,但是它对现有系统的改动较小,系统在处理正常音时性能接近传统MFCC参数,而且计算量明显小于MFCCExp-Log ,因此在某些应用情况下采用MFCCM 效果更好。 13.6今后的研究方向 关于耳语音的研究是一个综合了听觉生理学、心理学、认知科学以及信号和信息处理的多领域跨学科的课题,有着极其广阔的应用前景。但是相关的研究才刚刚开始,许多问题有待解决。如耳语音的韵律问题,目前是各国研究者非常兴趣的课题,现在仍处于初级研究阶段;耳语音的情感识别研究还没有展开;在已有的正常语音研究成果基础上,寻找适用于耳语语音的信号处理方法的研究,做为一个新兴课题,它还有许多问题需要去探讨。 1. 耳语音的声学特征分析与提取 以语音学的分析研究为基础,从工程信息处理角度去研究耳语语音信号处理的关键技术和方法。包括耳语语音信号中的特征分析和提取方法;研究新的耳语语音信息特征参数的提取、记述、变换、加工和表现方法。重点研究韵律学以外的耳语语音信息特征参数,如声管特征、气息特征等。由于耳语语音不同于正常语音的无基音和低声级发音模式,使得目前正常语音采用的韵律特征对于耳语语音来讲效果可能就不太明显。所以此前一些适用于正常语音识别的特征参数需要重新评估或者寻找新的参数。耳语语音的特点是声管变化与正常语音不同,而且是气声发音模式,所以还需要研究频谱的相关特征以及语音音质、气息等超音段特征的分析与提取。这些研究对于正常语音也具有参考研究价值。 2.耳语音的听觉感知特性的研究 耳语音是一种变异音,对于这种变异音人耳存在不同于正常音的感知特性,对此的解释是对于变异语音,人耳可以单独将变异信息分离出来送到大脑某一神经中枢来判读,而将剩余信息提交大脑语言神经中枢,最后综合两方面的信息得到完整的信息。因此人耳对于耳语音的听觉感知会发生那些不同于正常语音的变化、有什么特征参数可以有效的描述人们对耳语音的这种感知特性?在模式识别方面,传统方法是否依然有效,如果效果不佳,如何改进?上述问题都有待于各国学者的研究和证明。 3.耳语音信号处理的应用研究 耳语音信号处理是多领域跨学科的研究课题,有着极其广阔的应用前景,例如电子人工喉的发音带有金属声,发声越大,噪声越大,并且语气枯燥等,通过对耳语音信号处理技术的研究可以改善电子人工喉的发音性能。但是事实上耳语音相关的应用研究才刚刚开始,有许多领域的研究工作还没有展开,例如耳语音的情感信息处理技术的研究是一个非常重要的研究课题,因为该领域的研究成果有助于提高耳语音识别系统、耳语音说话人识别系统、耳语音合成系统等的鲁棒性和其它性能的提高。比如耳语音转换为正常音的研究应该是目前耳语音应用研究的主要内容,然而,不掌握耳语音的情感信息处理技术是谈不上耳语音与正常音的正确转换的。但是,关于这方面的研究报道还很少。因此,所有耳语语音的应用研究非常重要,但是,目前这方面的研究水平还很低,有许多问题急待解决。 完 13.1概述 13.2耳语音的声学特征分析 13.3耳语音增强 13.4耳语音转换正常音 13.5耳语音识别 13.6今后的研究方向 13.1 概述 耳语语音通常称为耳语音,它是人们常见的语言交流方式之一,在会场、音乐厅、图书馆等禁止大声喧哗的场所被广泛应用;在移动通信系统广泛发展的今天,人们也常常采用耳语的方式来保证通话的必威体育官网网址性并防止打扰他人。因此,耳语音的研

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档