基于SVM和GMM的说话人辨识方法研究-计算机科学与技术专业论文.docxVIP

下载本文档

0
0
约5.31万字
约 126页
2018-12-18 发布于上海
举报
版权申诉

基于SVM和GMM的说话人辨识方法研究-计算机科学与技术专业论文.docx

1、本文档共126页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于SVM和GMM的说话人辨识方法研究-计算机科学与技术专业论文

武汉理工大学硕士学位论文摘武汉理工大学硕士学位论文摘要说话人识别是根据语音波形中反映说话人生理和行为特征的语音参数，自动识别出相应说话人的过程。它是语音信号处理的一个重要研究方向，作为一种生物认证技术，具有广泛的应用前景，促使越来越多的人对其进行研究。目前，基于闭集的说话人识别已经取得了比较好的进展，但是基于开集的说话人识别的识别性能还有待提高。开集和闭集是对测试说话人集的一种划分，当测试的说话人集合仅局限在训练集内时，称其为基于闭集的说话人识别；当测试的说话人集合没有训练集限制，任何话者，不论训练与否，均能作为测试集合中的一员，则称其为基于开集的说话人识别。基于开集的说话人识别，不同于闭集说话人识别的关键是开集说话人识别不仅要对测试话者是否是训练集内的话者进行判断，而且若是训练集内的话者，则还要对其进行识别，识别出其是集内的哪个话者。本文致力于对基于开集说话人识别的研究，提出了一种新的识别方法，即基于SVM和GMM的说话人辨识方法。说话人辨识是指对说话人进行分辨和识别，分辨测试话者是否是训练集内话者，若是训练集内话者则还要识别出其是训练集内的哪位话者。用到的模型是SVM．GMM模型，该模型是结合了支持向量机 (SVM)和高斯混合(GMM)两种模型。支持向量机模型是以统计学习理论中VC维理论和结构风险最小原理为基础，根据有限的样本信息在模型的复杂性与学习能力之间寻求最佳折中，获得了较好的推广能力。大量的实验已经证实支持向量机有着优秀的分类能力，基于此，本研究将其选为第一步粗分类模型。而高斯混合模型是用多个高斯分布的线性组合，拟合说话人的特征分布。它能很好的描述说话人语音特征的内部的相似性。前人的研究也表明该模型是在说话人确认系统表现出良好的性能。故本研究选用高斯混合模型作为第二步精细的确认模型。在识别阶段，首先用支持向量机模型对测试的话者进行粗分类，然后再用高斯混合模型对分类结果进行确认，判断测试话者是否就是其在粗分类中所分到的类别。若是，则表明该测试话者就是其所分到类别所对应的话者；若否，则表明该测试话者是训练集外话者。本研究就是通过这种方法来实现对说话人进行分辨的。实验表明，本研究所提出的方法是有效的，能有效的提高对集外话者的分辨率。关键字：说话人识别，高斯混合模型，支持向量机模型，开集说话人识别，闭集说话人识别，确认阈值。武汉理工大学硕士学位论文Abstract 武汉理工大学硕士学位论文 Abstract Speaker recognition is a process of identifying the corresponding speaker, according to the parameters which represent the physiological and behavioral characteristics of the speakers voice．As a biometric authentication technology,it is all important research direction of the speech signal processing,with a wide range of applications，prompting more people to study it． At present，the speaker recognition based on the closed—set has been made relatively good progress．But the recognition performance of the speaker recognition based on an open-set needs to be improved．The open-set and the closed—set is a partition according to testing sets of speaker．When the testing set of speakers is a subset of the training set，it is called the speaker recognition based on the close—set．When the testing set is not restricted by the training set，no matter if training or not，it is called the speaker recognition based on the open-set．The speaker rec