关于音频比对的声纹识别技术.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
( )  第26 卷第4 期      佛山科学技术学院学报 自然科学版   . 26 . 4 V o l N o  2008 年7 月  ( ) . 2008 Jou rnal of Fo shan U n iversity N atu ral Science Edition Ju l 文章编号:(2008) 基于音频比对的声纹识别技术 王 东, 陈俊龙, 张鸿贤 (佛山科学技术学院 计算机系, 广东 佛山 528000) 摘要: 为了克服声纹识别技术在应用中存在识别率低、使用情况不稳定、音频特征难以确定等确定。通过大量实 验分析, 建立了一系列声纹识别的音频特征模型, 并对目前普遍使用的匹配算法进行改进。与传统的声纹识别 技术相比, 声纹识别的准确率提高了20% 。 关键词: 声纹识别; 音频特征; 特征模型; 匹配算法 中图分类号: TN 912. 34     文献标识码: A 随着社会的进步以及计算机技术的迅猛发展, 声纹识别技术逐渐成为了研究热点。声纹识别属于生 物特征识别技术, 是一种根据语音波形所反映的说话人生理和行为特征的语音参数的技术。声纹识别系 统主要包括两部分: 特征提取和模式匹配。特征提取的任务是选取惟一能表现说话人身份的有效且稳定 可靠的特征, 并以此作为身份验证的依据; 而模式匹配的任务是把提取的音频特征与训练时提取的音频 特征进行相似性匹配。 1 基本的声学特征 在对音频进行采样的过程中, 需要从采样的样本数据中提取表征说话人惟一特征的音频特征参数, 即能代表原始音频中主要信息的参数[ 1, 2 ]。 1. 1 短时能量 音频短时能量体现了音频信号的幅值随时间的变化情况, 其主要作用是区分话音成分和非话音成 分, 即用来区分“有说话区”和“无说话区”, 也可以用作语音端点检测。音频信号的短时能量定义为 1 N - 1 2 1,  0 ≤ i ≤N - 1 ( ) ( ) ( ) ( ) E n = i [S n i n - m ] , i = , 1 N ∑ 0,   o th erw ise   i= m ( ) ( ) 式 1 中, = 0~ - 1 , 如果 的起点不是从 = 0, 而是某个整数 , 那么相应的能量求和范围为 m N i i m ~ ( - 1) 。 m N 1. 2 短时过零率 过零率定义为单位时间内的过零次数, 其应用主要包括两类: 一类是用于粗略描述信号的频谱特 性, 另一类是用于判别一段音频信号中是否有语音。由于一般的过零率定义计算得到的值易受干扰, 因 此对其计算模型作出如下改进: 设一个门限 , 将过零的含义修改为超过正负门限, 可得下式 T ∞ sgn [x ( ) - T

文档评论(0)

xuefei111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档