- 1、本文档共126页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SVM和GMM的说话人辨识方法研究-计算机科学与技术专业论文
武汉理工大学硕士学位论文摘
武汉理工大学硕士学位论文
摘 要
说话人识别是根据语音波形中反映说话人生理和行为特征的语音参数,自 动识别出相应说话人的过程。它是语音信号处理的一个重要研究方向,作为一 种生物认证技术,具有广泛的应用前景,促使越来越多的人对其进行研究。
目前,基于闭集的说话人识别已经取得了比较好的进展,但是基于开集的说 话人识别的识别性能还有待提高。开集和闭集是对测试说话人集的一种划分, 当测试的说话人集合仅局限在训练集内时,称其为基于闭集的说话人识别;当 测试的说话人集合没有训练集限制,任何话者,不论训练与否,均能作为测试 集合中的一员,则称其为基于开集的说话人识别。基于开集的说话人识别,不 同于闭集说话人识别的关键是开集说话人识别不仅要对测试话者是否是训练集 内的话者进行判断,而且若是训练集内的话者,则还要对其进行识别,识别出 其是集内的哪个话者。
本文致力于对基于开集说话人识别的研究,提出了一种新的识别方法,即基 于SVM和GMM的说话人辨识方法。说话人辨识是指对说话人进行分辨和识别, 分辨测试话者是否是训练集内话者,若是训练集内话者则还要识别出其是训练 集内的哪位话者。用到的模型是SVM.GMM模型,该模型是结合了支持向量机
(SVM)和高斯混合(GMM)两种模型。 支持向量机模型是以统计学习理论中VC维理论和结构风险最小原理为基
础,根据有限的样本信息在模型的复杂性与学习能力之间寻求最佳折中,获得 了较好的推广能力。大量的实验已经证实支持向量机有着优秀的分类能力,基 于此,本研究将其选为第一步粗分类模型。而高斯混合模型是用多个高斯分布 的线性组合,拟合说话人的特征分布。它能很好的描述说话人语音特征的内部 的相似性。前人的研究也表明该模型是在说话人确认系统表现出良好的性能。 故本研究选用高斯混合模型作为第二步精细的确认模型。
在识别阶段,首先用支持向量机模型对测试的话者进行粗分类,然后再用高 斯混合模型对分类结果进行确认,判断测试话者是否就是其在粗分类中所分到 的类别。若是,则表明该测试话者就是其所分到类别所对应的话者;若否,则 表明该测试话者是训练集外话者。本研究就是通过这种方法来实现对说话人进 行分辨的。
实验表明,本研究所提出的方法是有效的,能有效的提高对集外话者的分辨率。
关键字:说话人识别,高斯混合模型,支持向量机模型,开集说话人识别,闭 集说话人识别,确认阈值。
武汉理工大学硕士学位论文Abstract
武汉理工大学硕士学位论文
Abstract
Speaker recognition is a process of identifying the corresponding speaker, according to the parameters which represent the physiological and behavioral characteristics of the speakers voice.As a biometric authentication technology,it is
all important research direction of the speech signal processing,with a wide range of
applications,prompting more people to study it.
At present,the speaker recognition based on the closed—set has been made relatively good progress.But the recognition performance of the speaker recognition based on an open-set needs to be improved.The open-set and the
closed—set is a partition according to testing sets of speaker.When the testing set of speakers is a subset of the training set,it is called the speaker recognition based on the close—set.When the testing set is not restricted by the training set,no matter if
training or not,it is called the speaker recognition based on the open-set.The speaker rec
您可能关注的文档
- 基于STUN协议的NAT穿越技术研究-通信与信息系统专业论文.docx
- 基于SUMO的公交信号优先仿真系统设计-交通信息工程及控制专业论文.docx
- 基于SUMO车载自组织网络路由协议的研究与实现-信号与信息处理专业论文.docx
- 基于SUMS公司核心业务绩效评估体系的研究-工商管理专业论文.docx
- 基于STS模块的光谱测试系统研究-电子与通信工程专业论文.docx
- 基于SUIF2的过程间分析和优化-计算机系统结构专业论文.docx
- 基于SUMO仿真的典型城市信号交叉口改进方案及其评价-交通信息工程及控制专业论文.docx
- 基于ST损伤向量的心肌缺血程度与部位的罗盘显示-机械电子工程专业论文.docx
- 基于Supermap Objects的城市信息管理系统的设计-市政工程专业论文.docx
- 基于ST壳资源价值重组利用的绩效研究政治经济学专业论文.docx
最近下载
- 关于集团对子公司绩效考核工作的思考与建议.pptx
- 国土调查类项目支出标准.docx VIP
- 读后续写动作描写六大微技能课件++2023届高考英语作文备考.pptx
- 2023年中考语文综合性学习6结束语(全国通用)(解析版).pdf VIP
- 新时代中小学教师职业行为十项准则学习知识讲解25页PPT.ppt VIP
- 河南郑州热力集团有限公司招聘笔试题库2024.pdf
- DB44T 1503-2014 家用电器碳足迹评价导则.docx
- 苯甲苯90000吨精馏塔设计说明.pdf
- 2024年03月苏州市相城区教育局2024年面向全区公办学校遴选局机关科室工作人员和教研员笔试历年高频考点试题附黑钻版答案与详解.docx VIP
- 2024年普通高中英语课程标准测试题.doc
文档评论(0)