基于稀疏编码的鲁棒说话人识别方法研究-计算机应用技术专业论文.docx

基于稀疏编码的鲁棒说话人识别方法研究-计算机应用技术专业论文.docx

  1. 1、本文档共122页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
111[1 111[1 11 II 111[1 1 I[I I II 国内图书分类号:TP391.4 Y304257 1 工学博士学位论文 基于稀疏编码的鲁棒说话人识别方法研究 博士研究生: 谢怡宁 导寸 9工IIJ:!,: 黄金杰 申请学位级别: 工学博士 学科、专业: 计算机应用技术 所在单位: 计算机科学与技术学院 答辩日期: 2016年6月 授予学位单位: 哈尔滨理工大学 万方数据 Classified Classified Index:TP39 1.4 Dissertation for the Doctor Degree in Engineering Robust Speaker Recognition Based on Sparse Coding candidate- Xie Yining Supervisor: Huang Jinj ie Academic Degree Applied for:Doctor of Engineering Specialty: Computer Applied Technology Date of Oral Examination: June,20 1 6 University: Harbin University of Science and Technology 万方数据 哈尔滨理工大学博士学位论文原创性声明本人郑重声明:此处所提交的博士学位论文《基于稀疏编码的鲁棒说话人 哈尔滨理工大学博士学位论文原创性声明 本人郑重声明:此处所提交的博士学位论文《基于稀疏编码的鲁棒说话人 识别方法研究》,是本人在导师指导下,在哈尔滨理工大学攻读博士学位期间独 立进行研究工作所取得的成果。据本人所知,论文中除已注明部分外不包含他 人已发表或撰写过的研究成果。对本文研究工作做出贡献的个人和集体,均已 在文中以明确方式注明。本声明的法律结果将完全由本人承担。 作者签名: 讨·” 日期:加,易年6月t o日 哈尔滨理工大学博士学位论文使用授权书 《基于稀疏编码的鲁棒说话人识别方法研究》系本人在哈尔滨理工大学攻读 博士学位期间在导师指导下完成的博士学位论文。本论文的研究成果归哈尔滨 理工大学所有,本论文的研究内容不得以其他单位的名义发表。本人完全了解 哈尔滨理工大学关于保存、使用学位论文的规定,同意学校保留并向有关部门 提交论文和电子版本,允许论文被查阅和借阅。本人授权哈尔滨理工大学可以 采用影印、缩印或其他复制手段保存论文,可以公布论文的全部或部分内容。 本学位论文属于 必威体育官网网址厂],在 年解密后适用授权书。 不必威体育官网网址I习I。 (请在以上相应方框内打√) 作者签名: 孙}弋纱豹 日期:加t k年多月l口日 新虢馘.N 臁加,占年占月,汐日 万方数据 摘要基于稀疏编码的鲁棒说话人识别方法研究 摘要 基于稀疏编码的鲁棒说话人识别方法研究 摘要 说话人识别又称声纹识别,是一种通过语音确定说话人身份的技术。由 于使用语音具有采集方便、成本低廉等优点,说话人识别被广泛用于生物认 证、安全监控、军事侦查和金融交互等领域,具有广阔的应用前景。数十年 来,世界各国的研究机构和公司企业纷纷投入大量人力物力展开研究,有力 地推动了说话人识别技术的发展。目前说话人识别技术已逐步从实验室走向 应用,而现实环境的复杂性对说话人识别提出了更高的要求,包括鲁棒性、 实时性、识别率和稳定性等。这就要求在说话人识别关键环节上有所突破, 尤其是语音活动检测、特征提取,以及说话人模型的构建等方面。 目前的说话人识别技术在干净语音环境下有理想的识别率,但在噪声环 境下,其性能会急剧降低,这阻碍了说话人识别技术走向现实应用。本文针 对说话人识别技术缺乏噪声鲁棒性的问题,将稀疏编码技术用于说话人识别 的各个环节,包括语音活动检测、语音特征提取和说话人建模等,提出了系 统的解决方案,以提高说话人系统在噪声环境下的识别率,主要工作包括以 下几个方面: 首先,从理论上分析了两种稀疏编码方法对噪声的建模能力,为稀疏编 码的应用奠定了基础。‘稀疏编码在对噪声的建模方面有两种方式:第一种用 残差对噪声建模,噪声的理论模型是高斯白噪声,其内在的假定在于语音在 语音字典上稀疏,而噪声在语音字典上不稀疏,白噪声在任何字典上都表现 得不稀疏,满足了这一要求;第二种采用一个噪声字典对噪声建模,其内在 假定在于语音和噪声在各自的字典上稀疏,且在自己的字典上比在对方的字 典上更稀疏。本文从理论上分析了这两种稀疏编码方式重构信号时误差的上 下限,然后用实验验证了理论分析的结论,表明当噪声不稀疏时,第一种方 法和第二种方法的重构误差在理论上有相同的下限和不同的上限;当噪声也 可能稀疏时,第二种方法增加了一个字典对噪声建模,融入了更多先验知识, 其重构误差上限要

文档评论(0)

peili2018 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档