网站大量收购独家精品文档,联系QQ:2885784924

声纹识别系统应用资料精要.ppt

  1. 1、本文档共75页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
经典模型——GMM(2) 一个M阶高斯混合模型的概率密度函数是由M个 高斯概率密度函数加权求和得到,如下: 其中M是混合模型的阶数,X是一个D维随机向量 wi是混合权重,满足: bi(X)是子分布,每个子分布是D维的联合高斯概 率分布,表示为: 是均值向量, 是协方差矩阵 经典模型——GMM(3) 完整的高斯混合模型由参数——均值向量、协方差矩阵和混合权重共同描述。因此,一个模型可表示为如下一个三元组: GMM计算结构: 经典模型——GMM(4) GMM的说话人鉴别(Speaker Identification)系统 UBM UBM——通用背景模型 UBM也是一个GMM,只是这个GMM需要用 大量的 不同说话人的语音数据经过训练来表 示说话 人无关的特征分布,这种特征是大多 数说话人的共性特征。 GMM-UBM 建模 说话人需要建立自己的模型时,就可以通过 自适应UBM来得到个性特征,即修正后的参 数,从而得到自己的GMM。 GMM-UBM优点 实现信道均衡 少量训练数据得到比较理想的说话人模型 说话人确认系统 GMM-UBM说话人确认系统 研究热点 技术难题:跨信道、噪声 实验室理想条件 √ 实际应用场合(远程、噪声背景) × 训练阶段 识别阶段 解决办法 信道补偿 支持向量机(SVM) 联合因子分析(JFA) 迁移学习(Transfer Learning) SVM训练 声纹识别—应用产品 USB Voice Key 声纹证件 公安系统 银行系统 声纹监听 多人识别 声纹比对 银行(电话,网上) 证券 银行卡,身份卡 声纹密匙 高档酒店,会员俱乐部,贵族商城等 玩具 汽车 个人电脑(家庭分级密码) 公安领域? 金融领域? 生活领域 ★ 声纹识别—潜在应用 典型应用—司法鉴定 我们开发的智能声纹识别系统,已成功应用在司法鉴定等领域。 目前已成功完成多个声纹鉴定(同一性认定)、声音完整性认定等项目,为司法部门提供了可靠的判断依据。 典型应用—科技馆 典型应用—教育系统 典型应用—教育系统 配置选项 在线测试 离线测试 添加说话人 添加新模型 累积训练 删除说话人 删除模型 说话人确认 说话人身份确认 波形图 实时语音波形 静音检测 典型应用— 基于声纹识别技术的电话语音远程考勤系统 电话通信中,通过识别来电号码(必须是固定电话)和来电者说话声音的个人特征,我们的系统就可以快速的自动判断被监控人是否在规定的时间出现在规定的场所执行任务,以及记录在该场所停留的时间长度。 这个技术方案主要应用在电话远程考勤、移动办公、医疗服务监控、监狱管理、劳改犯人的狱外服刑以及对假释犯罪嫌疑人的自动监控等方面。 参考资料 X.D. Huang, A. Acero, and H.-W. Hon, Spoken Language Processing: a Guide to Theory, Algorithm, and System Development, Upper Saddle River, New Jersey: Prentice Hall, 2001. L.R. Rabiner and B.-H. Juang, Fundamentals of Speech Recognition, Prentice-Hall, Englewood Cliffs, 1993. T. Kinnunen, H.Z. Li, An overview of text-independent speaker recognition: From features to supervectors, Speech Communication, Volume 52, Issue 1, January 2010, Pages 12-40. HTK: http://htk.eng.cam.ac.uk/ Sensory: TalentedSoft: CTI论坛: / * * * * Content Layouts 最佳路径问题(如何求:Q=q1q2…qT) 前向-后向算法的缺点 计算量的浪费 状态路径不能明确判定 Viterbi算法 不完全的状态空间有哪些信誉好的足球投注网站 保留状态转移路径的信息 * 最佳路径问题(如何求:Q=q1q2…qT) Viterbi算法的有哪些信誉好的足球投注网站空间 * Viterbi识别算法和路径回溯 * 模型训练问题(如何求:A、B、π) 优化问题 优化目标:P(O|λ)最大 Lagrange数乘法,辅助函数: * Baum-Welch参数重估算法: * 模型训练问题(如何求:A

文档评论(0)

baobei + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档