基于稀疏编码的鲁棒说话人识别方法研究-计算机应用技术专业论文.docx

下载文档 降价啦

0
0
约11.02万字
约 122页
2019-03-28 发布于上海
举报
版权申诉
保障服务

基于稀疏编码的鲁棒说话人识别方法研究-计算机应用技术专业论文.docx

1、本文档共122页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

111[1 111[1 11 II 111[1 1 I[I I II 国内图书分类号：TP391．4 Y304257 1 工学博士学位论文基于稀疏编码的鲁棒说话人识别方法研究博士研究生：谢怡宁导寸 9工IIJ：!，：黄金杰申请学位级别：工学博士学科、专业：计算机应用技术所在单位：计算机科学与技术学院答辩日期： 2016年6月授予学位单位：哈尔滨理工大学万方数据 Classified Classified Index：TP39 1．4 Dissertation for the Doctor Degree in Engineering Robust Speaker Recognition Based on Sparse Coding candidate- Xie Yining Supervisor： Huang Jinj ie Academic Degree Applied for：Doctor of Engineering Specialty： Computer Applied Technology Date of Oral Examination： June，20 1 6 University： Harbin University of Science and Technology 万方数据哈尔滨理工大学博士学位论文原创性声明本人郑重声明：此处所提交的博士学位论文《基于稀疏编码的鲁棒说话人哈尔滨理工大学博士学位论文原创性声明本人郑重声明：此处所提交的博士学位论文《基于稀疏编码的鲁棒说话人识别方法研究》，是本人在导师指导下，在哈尔滨理工大学攻读博士学位期间独立进行研究工作所取得的成果。据本人所知，论文中除已注明部分外不包含他人已发表或撰写过的研究成果。对本文研究工作做出贡献的个人和集体，均已在文中以明确方式注明。本声明的法律结果将完全由本人承担。作者签名：讨·” 日期：加，易年6月t o日哈尔滨理工大学博士学位论文使用授权书《基于稀疏编码的鲁棒说话人识别方法研究》系本人在哈尔滨理工大学攻读博士学位期间在导师指导下完成的博士学位论文。本论文的研究成果归哈尔滨理工大学所有，本论文的研究内容不得以其他单位的名义发表。本人完全了解哈尔滨理工大学关于保存、使用学位论文的规定，同意学校保留并向有关部门提交论文和电子版本，允许论文被查阅和借阅。本人授权哈尔滨理工大学可以采用影印、缩印或其他复制手段保存论文，可以公布论文的全部或部分内容。本学位论文属于必威体育官网网址厂]，在年解密后适用授权书。不必威体育官网网址I习I。 (请在以上相应方框内打√) 作者签名：孙}弋纱豹日期：加t k年多月l口日新虢馘．N 臁加，占年占月，汐日万方数据摘要基于稀疏编码的鲁棒说话人识别方法研究摘要基于稀疏编码的鲁棒说话人识别方法研究摘要说话人识别又称声纹识别，是一种通过语音确定说话人身份的技术。由于使用语音具有采集方便、成本低廉等优点，说话人识别被广泛用于生物认证、安全监控、军事侦查和金融交互等领域，具有广阔的应用前景。数十年来，世界各国的研究机构和公司企业纷纷投入大量人力物力展开研究，有力地推动了说话人识别技术的发展。目前说话人识别技术已逐步从实验室走向应用，而现实环境的复杂性对说话人识别提出了更高的要求，包括鲁棒性、实时性、识别率和稳定性等。这就要求在说话人识别关键环节上有所突破，尤其是语音活动检测、特征提取，以及说话人模型的构建等方面。目前的说话人识别技术在干净语音环境下有理想的识别率，但在噪声环境下，其性能会急剧降低，这阻碍了说话人识别技术走向现实应用。本文针对说话人识别技术缺乏噪声鲁棒性的问题，将稀疏编码技术用于说话人识别的各个环节，包括语音活动检测、语音特征提取和说话人建模等，提出了系统的解决方案，以提高说话人系统在噪声环境下的识别率，主要工作包括以下几个方面：首先，从理论上分析了两种稀疏编码方法对噪声的建模能力，为稀疏编码的应用奠定了基础。‘稀疏编码在对噪声的建模方面有两种方式：第一种用残差对噪声建模，噪声的理论模型是高斯白噪声，其内在的假定在于语音在语音字典上稀疏，而噪声在语音字典上不稀疏，白噪声在任何字典上都表现得不稀疏，满足了这一要求；第二种采用一个噪声字典对噪声建模，其内在假定在于语音和噪声在各自的字典上稀疏，且在自己的字典上比在对方的字典上更稀疏。本文从理论上分析了这两种稀疏编码方式重构信号时误差的上下限，然后用实验验证了理论分析的结论，表明当噪声不稀疏时，第一种方法和第二种方法的重构误差在理论上有相同的下限和不同的上限；当噪声也可能稀疏时，第二种方法增加了一个字典对噪声建模，融入了更多先验知识，其重构误差上限要