模式识别-第8讲-近邻法解读.ppt

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 快速有哪些信誉好的足球投注网站近邻法 用树结构表示样本分级: p: 树中的一个结点,对应一个样本子集Kp Np : Kp中的样本数 Mp : Kp中的样本均值 rp : 从Kp中任一样本到Mp的最大距离 快速有哪些信誉好的足球投注网站近邻法 (2)快速有哪些信誉好的足球投注网站算法 要实现快速有哪些信誉好的足球投注网站近邻,需要有方法快速判断某个样本子集是否是该待识样本的可能近邻样本集,从而可将无关的样本子集尽快排除;另一方面在某样本子集内寻找哪个样本是近邻时,需快速排除不可能为近邻的样本。 这两个快速判别算法可用以下两个规则表示。 快速有哪些信誉好的足球投注网站近邻法 规则1: 如果存在 则 不可能是X的近邻。其中B是待识别样本在有哪些信誉好的足球投注网站近邻过程中的当前近邻距离,B在有哪些信誉好的足球投注网站过程中不断改变与缩小。算法开始可将B设为无穷大。 表示待识样本X到结点 的均值点距离。 快速有哪些信誉好的足球投注网站近邻法 规则2:如果 其中Xi∈ ,则Xi不可能是X的近邻。 由此可见,只要将每个样本子集 中的每个样本Xi到其均值Mp的距离D(Xi,Mp)存入存储器中,就可利用上式将许多不可能成为测试样本近邻的训练样本排除。 快速有哪些信誉好的足球投注网站近邻法 (3)有哪些信誉好的足球投注网站算法 有哪些信誉好的足球投注网站算法的大体过程是这样的: 当有哪些信誉好的足球投注网站树形样本集结构由高层次向低层次深入时,对同一层次的所有结点,可以利用规则1排除掉一些不可能包含待识别样本的近邻的结点(样本子集)。但是这往往不能做到只留下唯一的待有哪些信誉好的足球投注网站结点,因此必须选择其中某一结点先深入有哪些信誉好的足球投注网站,以类似于深度优先的方法确定有哪些信誉好的足球投注网站路径直至叶结点。然而在该叶结点中找到的近邻并不能保证确实是全样本集中的最近邻者,所找到的该近邻样本需要在那些有可能包含最近邻的样本子集中核对与修正,直至找到真正的最近邻样本为止。 树有哪些信誉好的足球投注网站算法 置B=∞,L=0,p=0 将当前结点的所有直接后继结点放入一个目录表中,并对这些结点计算D(x,Mp) 根据规则1从目录表中去掉step2中的某些结点 如果目录表已无结点则置L=L-1,如果L=0则停止,否则转Step3。如果目录表有一个以上的结点,则转step5 在目录表中选出最近结点p’为当前执行结点。如果当前的水平L是最终水平,则转Step6,否则置L=L+1,转Step2 对当前执行结点p’中的每个xi,根据规则2决定是否计算D(x, xi)。若D(x, xi)B,则置NN=i和B= D(x, xi),处理完当前执行结点中的每个xi后转Step3 当算法结束时,输出x的最近邻xNN和x与xNN的距离B 3.2 改进的近邻法-剪辑近邻法 目的:去掉靠近两类中心的样本? 基本思想:当不同类别的样本在分布上有交迭部分的,分类的错误率主要来自处于交迭区中的样本。当我们得到一个作为识别用的参考样本集时,由于不同类别交迭区域中不同类别的样本彼此穿插,导致用近邻法分类出错。因此如果能将不同类别交界处的样本以适当方式筛选,可以实现既减少样本数又提高正确识别率的双重目的。为此可以利用现有样本集对其自身进行剪辑。 3.2 改进的近邻法-剪辑近邻法 剪辑的过程是:将样本集KN分成两个互相独立的子集:考试(test)集KT和参考(reference)集KR。首先对KT中每一个Xi在参考集KR中找到其最近邻的样本Yi(Xi) 。如果Yi与Xi不属于同一类别,则将Xi从考试集KT中删除,最后得到一个剪辑的样本集KTE(剪辑样本集),以取代原样本集,对待识别样本进行分类。 剪辑的结果是去掉两类边界附近的样本。 MULTIEDIT算法 正太分布样本集合 正太分布样本集合 正太分布样本集合 正太分布样本集合 非正太分布样本集合 非正太分布样本集合 非正太分布样本集合 3.3 改进的近邻法-压缩近邻法 压缩近邻法:利用现有样本集,逐渐生成一个新的样本集,使该样本集在保留最少量样本的条件下,仍能对原有样本的全部用最近邻法正确分类,那么该样本集也就能对待识别样本进行分类,并保持正常识别率。 3.3 改进的近邻法-压缩近邻法 定义两个存储器,一个用来存放即将生成的样本集,称为Store;另一存储器则存放原样本集,称为Grabbag。其算法是: 初始化。Store是空集,原样本集存入Grabbag;从Grabbag中任意选择一样本放入Store中作为新样本集的第一个样本。 样本集生成。在Grabbag中取出第i个样本用Store中的当前样本集按最近邻法分类。若分类错误,则将该样本从Grabbag转入Store中,若分类正确,则将该样本放回Grabbag中。 结束过程。若Grabbag中所有样本在执行第二步时没有发生转入Store的现象,或Grabbag已成空集,则算法终止,否则转入第二步。 4. 最佳距离度量近邻法 在x的局部临近区域中,定义新的距离函数

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档