声纹识别技术学习报告.PDF

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
声纹识别技术学习报告

声纹识别技术学习报告 Yuwei Qiu tsinghua university 1,定义 声纹识别,生物识别技术的一种。也称为说话人识别, 有两类,即说话人辨认和说话人确认。不同的任务和 应用会使用不同的声纹识别技术,如缩小刑侦范围时 可能需要辨认技术,而银行交易时则需要确认技术。 图一是 《科大讯飞 MSC 新手指南(iOS)》上对声纹密码的解释。 图二是生活中最普遍应用的声纹识别技术:手机微信登录界面。通 过事前录制账户人的声音,预先分析说话人声音,实现语音解锁。 图1 图2 2,模型 说话人辨认可以分为开集(open-set)辨认和闭集(close-set)辨认。前者假定待识别说 话人可以在集合外,而后者假定待识别说话人在集合内。设定时,通常需要训练一个假 冒者模型或背景模型,以便拒识时有可资比较的对象,阈值容易选定。而建立背景模型 的好坏直接影响到拒识甚至声纹识别的性能。一个好的背景模型,往往需要通过预先采 集好的若干说话人的数据,通过某种算法去建立。 3,优缺点评估 缺点1)声音具有易变性,易受身体状况、年龄、情绪等的影响。 缺点2)麦克风和信道对识别性能有影响。 缺点3)环境噪音对识别有干扰。 优势 1)蕴含声纹特征的语音获取方便、自然,声纹提取可在不知不觉中完成,因此使 用者的接受程度也高。 优势2)获取语音的识别成本低廉,使用简单,一个麦克风即可,在使用通讯设备时更 无需额外的录音设备。 优势3)适合远程身份确认,只需要一个麦克风或电话、手机就可以通过网路 4, 流程 (图3) 语音信号处理 声纹特征提取 声纹建模 声纹比对 判别决策 图3 5, 系统配置 1)系统环境——xcode mac 系统下的 xcode ,有类似于 Windows 系统下c/c++语言类似的功 能,属于一种系统开发语言,特别是 对于ios 系统下的app 开发有很重要 的意义。 2)Java kit jdk 是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java 应 用程序。 3)声纹识别sdk Sdk——软件开发工具包(外语首字母缩写:SDK、外语全称:Software Development Kit)一般都是一些软件工程师为特定的软件包、软件框架、硬件平台、操作系统等 建立应用软件时的开发工具的集合。 从讯飞开放网站上下载了sdk 软件包,在xcode 环境下,进行如图framework 的加 载。(图4) 图4 6,应用 1)信息领域。 2)银行、证券。 3)公安司法。 4)军队和国防。 5)保安和证件防 伪。

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档