声纹识别技术学习报告.PDF

下载文档

55
0
约1.56千字
约 2页
2017-06-25 发布于天津
举报
版权申诉
保障服务

声纹识别技术学习报告.PDF

1、本文档共2页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

声纹识别技术学习报告

声纹识别技术学习报告 Yuwei Qiu tsinghua university 1，定义声纹识别，生物识别技术的一种。也称为说话人识别，有两类，即说话人辨认和说话人确认。不同的任务和应用会使用不同的声纹识别技术，如缩小刑侦范围时可能需要辨认技术，而银行交易时则需要确认技术。图一是《科大讯飞 MSC 新手指南(iOS)》上对声纹密码的解释。图二是生活中最普遍应用的声纹识别技术：手机微信登录界面。通过事前录制账户人的声音，预先分析说话人声音，实现语音解锁。图1 图2 2，模型说话人辨认可以分为开集(open-set)辨认和闭集(close-set)辨认。前者假定待识别说话人可以在集合外，而后者假定待识别说话人在集合内。设定时，通常需要训练一个假冒者模型或背景模型，以便拒识时有可资比较的对象，阈值容易选定。而建立背景模型的好坏直接影响到拒识甚至声纹识别的性能。一个好的背景模型，往往需要通过预先采集好的若干说话人的数据，通过某种算法去建立。 3，优缺点评估缺点1）声音具有易变性，易受身体状况、年龄、情绪等的影响。缺点2）麦克风和信道对识别性能有影响。缺点3）环境噪音对识别有干扰。优势 1）蕴含声纹特征的语音获取方便、自然，声纹提取可在不知不觉中完成，因此使用者的接受程度也高。优势2）获取语音的识别成本低廉，使用简单，一个麦克风即可，在使用通讯设备时更无需额外的录音设备。优势3）适合远程身份确认，只需要一个麦克风或电话、手机就可以通过网路 4，流程（图3）语音信号处理声纹特征提取声纹建模声纹比对判别决策图3 5，系统配置 1）系统环境——xcode mac 系统下的 xcode ，有类似于 Windows 系统下c/c++语言类似的功能，属于一种系统开发语言，特别是对于ios 系统下的app 开发有很重要的意义。 2）Java kit jdk 是 Java 语言的软件开发工具包，主要用于移动设备、嵌入式设备上的java 应用程序。 3）声纹识别sdk Sdk——软件开发工具包（外语首字母缩写：SDK、外语全称：Software Development Kit）一般都是一些软件工程师为特定的软件包、软件框架、硬件平台、操作系统等建立应用软件时的开发工具的集合。从讯飞开放网站上下载了sdk 软件包，在xcode 环境下，进行如图framework 的加载。（图4）图4 6，应用 1）信息领域。 2）银行、证券。 3）公安司法。 4）军队和国防。 5）保安和证件防伪。