《基于支持向量机的声纹识别》.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于支持向量机的声纹识别 摘要:声纹识别这种技术的实现使人类向人机自由交流迈进了一大步。支持向量机是一种基于统计的新型机器学习方法,也是模式识别中常用的一种分类方法。本文采用MFCC对语音信号进行特征提取,测试音通过SVM识别算法与训练的说话人语音模板进行匹配。 关键词:支持向量机、声纹识别、核函数、最优分离超平面 1前言 基于声纹识别具有声纹识别有不会遗失、无须记忆和使用方便等优点,使其有着广阔的市场与应用前景。通过这种技术,可以利用人本身的生物特征进行身份鉴别。声纹识别就是根据集成在语音波上的个人信息,自动判别说话的人是谁。简单来说,声纹识别过程就是:特征提取阶段的语音特征获取过程,训练阶段的用户语音模板或模型建立过程和识别阶段的模式匹配与判决过程。 声纹识别主要采用线性预测倒谱系数(LPCC)、美尔倒谱系数(MFCC)的声纹特征,识别模型采用向量量化模型(VQ)、隐马尔可夫模型(HMM)、高斯混合模型(GMM)、支持向量机模型(SVM)等。GMM和HMM适合处理连续信号,而SVM适合于分类问题。GMM和HMM受极大似然准则的限制,类别区分能力较弱,其结果反映了同类样本的相似度,而SVM的输出结果则体现了异类样本间的差异,具有很强的分类能力。与神经网络相比SVM能较好地解决网络结构的问题、过学习与欠学习问题、局部极小点问题等,而在解决非线性、小样本、算法复杂、高维数等识别问题中也有明显的特定优势。以此现在采用有效的机器学习方法改造识别模型以及修正声纹特征被认为是提升声纹识别性能的关键途径之一。 2支持向量机 2.1SVM 是从线性可分情况下的最优分类面发展而来的, 所谓最优分类线就是要求分类线不但能将两类正确分开(训练错误率为0),而且使分类间隔最大.推广到高维空间,最优分类线就变为最优分类面。设D维空间中的线性判别函数: Linear classifier: ,i=1,…,l 分类面方程: H1:;H2: The margin is : 。这样分类间隔就等于 ,因此要求分类间隔最大,就要求最大.而要求分类面对所有样本正确分类,就是要求满足则称训练集是线性可分的。 要使最大,可建立Lagrange函数: 得到: Maximizing : , The form of the final solution: Total number of samples to be generated =100 Linearly separable data: 2.2 非线性可分 Slack variables can be added to allow misclassification of difficult or noisy examples, when the data points are not linearly separable. Minimizing : 得到: Subject to : , 折衷考虑最少错分样本和最大分类间隔,就得到广义最优分类面,其中,C0是一个常数,它控制对错分样本惩罚的程度。Lagrange乘子需要C的限制。线性可分的情况相当于C→∞,松弛变量和相关的Lagrange乘子都是间接参与问题,他们的存在通过C间接的反映出来。下图显示了C=1,100,10000时SVM的分类情况, SVM的关键在于核函数。支持向量机可以找到一个非线性映射,把输入空间中的线性不可分数据集映射到高维特征空间中的线性可分数据集中。低维空间向量集通常难于划分,解决的方法是将它们映射到高维空间。但这个办法带来的困难就是计算复杂度的增加,而核函数正好巧妙地解决了这个问题。也就是说,只要选用适当的核函数,就可以得到高维空间的分类函数。在SVM理论中,采用不同的核函数将导致不同的SVM算法。 常用的核有以下几种: (1 ) Linear kernel :K( x,xi) =xi·x (2 ) Polynomial kernel:K( x,xi) =(s(xi·x)+c)d,d=1,2,…,N 其中s,c,d为参数,显然,线性核函数可以看作多项式核函数的一种特殊情况。 (3 ) RBF kernel:K( x,xi)=exp(-‖x-xi‖2/2 2) (4 ) Sigmoid kernel:K( x,xi)=tanh(xi·x+b) 支持向量机可以选用满足一定条件的核函数,把在输入空间中线性不可分问题映射到一个特征空间的线性可分问题,即确定最优分离超平面。 Total number of samples to be generated =50 Non-separate data polynomial kernel:

文档评论(0)

189****3564 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档