- 1、本文档共56页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大连理工大学硕士学位论文摘
大连理工大学硕士学位论文
摘 要
基于生物特征的身份识别技术是当前国际上的重点研究内容,声纹识别是通过语音 识别说话人的身份,在系统安全认证、司法鉴定、金融服务以及电子侦听等领域有着广 泛的应用价值,而且比起其他生物特征识别技术如指纹识别、脸部识另B等,更加经济简 便,特别是对于远距离身份确认更为有效。
本文在对现有声纹识别技术进行深入研究的基础上,选取目前应用最广泛、有效的
语音信号特征提取方案~一美尔倒频谱系数(姗cC)和语者数学模型一一高斯混合模
型(GMM),构架了识别系统。对于语者辨识,语者特定模型直接用语者的语料借助 于期望值最大化算法(EM)来训练,辨识算法采用了最大事后概率法则(MAP);而 对于语者确认,为了减少语者自己语音本身的变异性,只留下语者间彼此的变异性,在 建立语者特定模型时,先训练一个语者不特定模型,然后基于一种贝叶斯语者调适法的 原理用语者的训练语料将语者不特定模型调适成语者特定模型,后端匹配则结合语者特 定模型与预先训练好的背景模型(UBM)来建立一个对数相似值比侦测器,利用它求 取语者分数并根据门槛值得出最终的结果。
本文重点研究了后端模式匹配算法,在模型的训练过程中引入了模糊C.均值聚类算 法(FCM),使识别效果获得了明显改进。这种算法在聚类方面具有高鲁棒性,将其引 入到EM训练算法中代替常用的硬聚类算法来寻求模型的初始点,可使GMM模型收敛至 一个更好的局部最优点。最终的试验结果证明,采用上述各项方法构造的声纹识别系统 具有优越的识别性能,其中语者确认系统平均可达N4.7%的相等错误率(EER);而
改进的算法可使识别率平均提蔚5%。
关键词:声纹识别;高斯混合模型;美尔倒频谱系数;期望值最大化算;模糊C一均值
聚类算法
朱少雄:声纹识别系统与模式匹配算法研究Research
朱少雄:声纹识别系统与模式匹配算法研究
Research on Voiceprint Recognition and Algorithm of Pattern Match
Abstract
Voiceprint Recognition fvR)as one of the biometric identification research aims to identify living persons from their voice.It is useful in person authentication,forensics and speaker tracking,etc.Comparing tO other biometric identification methods like fingerprint or face recognition,voiceprint recognition doesn’t require expensive specialized equipments and are effective especially for remote idenfity verification
After studying the voiceprint recognition techniques already exist,this thesis constructs a
recognition system based On Mel--scale Frequency Cepstml Coefficients(MFCC)·-·-speech signal feature extraction method and Gaussian Mixture Model(GMM)一speaker mathematical model which both are popular and effective for voiceprint recognition For speaker identification., Expectation Maximization Algorithm饵M)is adopted to train speaker dependent model,and
afterwards recognize speaker according to Maximum a Posteriori Criterion(MAP)For speaker verification,in order to reduce Inner Speaker V撕ation and maintain Outer Speaker Variation,a speaker independent model is trained first,and then the model is a
您可能关注的文档
- 老年非小细胞肺癌术前新辅助靶向治疗的病例报告-外科学专业论文.docx
- 累积冲击模型的维修更换策略研究-统计学专业论文.docx
- 论我国刑事申诉制度的完善-法律专业论文.docx
- 硫代葡萄糖苷盐类物质的高效液相色谱分析及其结构鉴定研究-分析化学专业论文.docx
- 论侦查权的监督-诉讼法专业论文.docx
- 离职后竞业禁止合同效力判断-民商法专业论文.docx
- 论高中语文选修课教学的问题及有效教学的途径-学科教学·语文专业论文.docx
- 蓝牙无线通信系统的HCI和L2CAP协议的分析与实现-信号与信息处理专业论文.docx
- 论引进二手刨花板生产线的建设-林业工程领域专业论文.docx
- 快速成型过程中精度控制及其传递规律的研究-材料加工工程专业论文.docx
文档评论(0)