- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章特征选择与特征提取.
第五章 特征选择与特征提取
5.1 问题的提出
前面主要介绍的是各种分类器的设计方法,实际上我们已经完全可以解决模式识别的问题了。然而在实际应用中,在分类器设计之前,往往需要对抽取出的特征进行一下处理,争取尽量减小特征的维数。在实践中我们发现,特征的维数越大,分类器设计的难度也越大,一维特征的识别问题最容易解决,我们只要找到一个阈值,大于的为一类,小于的为一类。同时特征维数越大,要求的训练样本数量越多,例如在一维的情况下,10个训练样本就可以比较好的代表一个类别了,而在10维空间中,10个训练样本则是远远不够的。这一章中我们就来介绍一下减小特征维数的方法。
一般来说模式识别系统的输入是传感器对实物或过程进行测量所得到的一些数据,其中有一些数据直接可以作为特征,有一些数据经过处理之后可以作为特征,这样的一组特征一般称为原始特征。在原始特征中并不一定每个特征都是有用的,比如在识别苹果和橙子的系统中,我们可以抽取出的特征很多,(体积,重量,颜色,高度,宽度,最宽处高度),同样还有可能抽取出其它更多的特征。在这些特征中对分类有用的是(颜色,高度,最宽处高度),其它特征对识别意义不大,应该去除掉。这样的过程称为是特征选择,也可以称为是特征压缩。
特征选择可以描述成这样一个过程,原始特征为维特征,从中选择出个特征构成新的特征矢量,。
同时,特征矢量的每一个分量并不一定是独立的,它们之间可能具有一定的相关性,比如说高度和最宽处的高度,高度值越大,最宽处的高度值也越大,它们之间具有相关性,我们可以通过一定的变换消除掉这种相关性,比如取一个比值:最宽处的高度/高度。这样的过程称为特征提取。
特征提取可以描述为这样一个过程,对特征矢量施行变换:,,,产生出降维的特征矢量。
在一个实际系统的设计过程中,特征的选择和提取过程一般都需要进行,首先进行特征选择,去除掉无关特征,这些特征实践上根本就不需要抽取出来,这部分传感器根本不需要安装,这样也可以减小系统的的成本。然后进行特征提取,降低特征的维数。然后利用降维之后的样本特征来设计分类器。
5.2 模式类别的可分性判据
在讨论特征选择和特征压缩之前,我们先要确定一个选择和提取的原则。对一个原始特征来说,特征选择的方案很多,从维特征种选择出个特征共有中选法,其中哪一种方案最佳,则需要有一个原则来进行指导。同样,特征的压缩实际上是要找到个元函数,元函数的数量是不可数的,这也要有一个原则来指导找出个最佳的元函数。
我们进行特征选择和特征提取的最终目的还是要进行识别,因此应该是以对识别最有利原则,这样的原则我们称为是类别的可分性判据。用这样的可分性判据可以度量当前特征维数下类别样本的可分性。可分性越大,对识别越有利,可分性越小,对识别越不利。
人们对的特征的可分性判据研究很多,然而到目前为止还没有取得一个完全满意的结果,没有哪一个判据能够完全度量出类别的可分性。下面介绍几种常用的判据,我们需要根据实际问题,从中选择出一种。
一般来说,我们希望可分性判据满足以下几个条件:
与识别的错误率由直接的联系,当判据取最大值时,识别的错误率最小;
当特征独立时有可加性,即:
是第类和第类的可分性判据,越大,两类的可分程度越大,为维特征;
应具有某种距离的特点:
,当时;
,当时;
;
单调性,加入新的特征后,判据不减小:
。
但是遗憾的是现在所经常使用的各种判据很难满足上述全部条件,只能满足一个或几个条件。
一、基于几何距离的可分性判据
在介绍这一类判据之前,先来看一下各种几何距离的定义。
点与点的距离
这是我们前面已经介绍过的一种距离,可以有多种形式,如欧氏距离、街市距离、马氏距离等,特征矢量和之间的距离可以表示为:
(欧氏距离)
点与类别之间的距离
这也是我们前面定义过的一种距离度量,常用的有:平均样本法、平均距离法、最近距离法,-近邻法等。特征矢量与类别之间距离的平方可以表示为:
(平均距离法)
其中为类中的样本,为类别中的样本数。
类内距离
设了由样本集,样本的均值矢量为,则由样本集定义的类内均方距离为:
当取欧氏距离时有:
类别之间的距离
在第二章中对类别之间的距离也做过定义,包括最短距离法,最长距离法,类平均距离法等。类与类之间的距离可以表示为:
(平均距离法)
当取欧氏距离时,可定义两类之间的均方距离:
有了距离度量之后,我们就可以在此基础上定义可分性测度了。一般来讲,当各个类别的类内距离越小时可分性越强,而类间距离越大时,可分性越强。因此可以有以各类样本之间的平均距离作为判据:
所反映的主要还是类别之间的分离程度,对类内的聚集程度反映不够。通常我们采用跟一般的矩阵形式来构造可分性判据。
类内散度矩阵
设有个类别,,类样本集,类的散度矩阵定义为:
总的类内散度矩阵为:
您可能关注的文档
最近下载
- 基于51单片机的智能台灯设计.doc
- 幼儿园课件:小老鼠和泡泡糖最终.pptx
- 2024必威体育精装版国开《个人理财》形考题库.docx VIP
- 国家开放大学学前教育专业+毕业作业(幼儿园教学活动设计与指导)9.doc
- 第18课 从九一八事变到西安事变(课件).pptx VIP
- 酒店装配式装修技术规程.pdf VIP
- 2023年中国汉字听写大赛全部试题库及答案.pdf VIP
- 2024中国铁路成都局集团限公司招聘高校毕业生998人高频考题难、易错点模拟试题(共500题)附带答案详解.docx
- 人文英语3--An-absence-excuse-letter完整版.docx
- 神经工程学(天津大学)大学MOOC慕课 客观题答案.docx
文档评论(0)