- 1、本文档共59页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ClusterAnalysis(聚类分析)课件
四、中间距离法 最长距离 最短距离 中间距离 中间距离法的递推公式 若在某步聚类中将类p与q合并为类r,则任一类k与新类r的距离: 当β=-0.25时,为三角形中线: 五、重心法(Centroid clustering): 含义: 两类间的距离定义为两类重心(均值点)之间的的距离 ? ? 例题:数据如前 样品间距离为欧氏距离时的递推公式 Gr Gt 重心法虽有较好的代表性,但并未充分利用各个样品的信息.比如下面两组类按重心法类间距离相等,这是不合理的. 六、类平均法(Between-group Linkage) 含义:类间距离为所有样品对间的平均距离。 ? ? ? ? ? ? 利用了所有样品对距离的信息 类与类之间的距离平方为两类样品两两之间的距离平方的平均,即 类平均法的类间距离: 合并新类的距离递推公式: 设某一步将Gp和Gq合并成Gr,它们所包含的样品个数分别为np ,nq和nr(nr=np+nq).Gr与其他类Gk的类间距离的递推公式为 七.离差平方和法 (Ward’s method ) 类似于方差分析的想法,如果类分得恰当,同类内的样品之间的离差平方和应较小,而类间的离差平方和应当较大。 其中 是由Gp和Gq合并成的Gr类的类内离差平方和。可以证明离差平方和法的类间递推公式为 例题:数据如前 八、系统聚类法的软件实现——SPSS 以教材88页例题1为例,SPSS处理: 1、Analyze-Classify-Hierarchical Cluster 2、把dxbz、czbz、wmbz选入Variables 3、若对样品聚类(Q型聚类):在Cluster选Cases; 若对变量聚类(R型聚类)则在Cluster选Variables 4、选Plots,再点Dendrogram,则画出树状图; 若点Icicle,则画出冰挂图,其中Orientation中(Vertical为纵向冰挂图;Horizontal为横向冰挂图)。 …….. 九、 系统聚类法的基本性质 (一) 单调性 在聚类分析过程中,并类距离分别为l k(k=1,2,3,…?)若满足 ,则称该聚类方法具有单调性。可以证明除了重心法和中间距离法之外,其他的系统聚类法均满足单调性的条件。 (二)空间的浓缩和扩张 1、定义矩阵的大小 设同阶矩阵D(A)和D(B),如果D(A)的每一个元素 小于D(B)的每一个元素,则记为 。 2、空间的浓缩和扩张 设有两种系统聚类法A和B,他们在第i步的距离矩阵分别为Ai和Bi(I=1,2,3…),若AiBi ,则称第一种方法A比第二种方法B使空间扩张,或第二种方法比第一种方法浓缩。 3、方法的比较 D(短) D(平),D(重) D(平); D(长) D(平); 当 ,D(变平) D(平); 当 ,D(变平) D(平)。 1.由适当的阈值确定 介绍系统聚类法的基本步骤时,由谱系聚类图及临界值,即可给出分类结果. 2.根据数据点的散布图直观地确定类的个数 3.根据谱系图确定分类个数的准则 4.根据统计量确定分类个数 十、确定类个数的几种常见方法: 黛米尔曼(Demirmen,1972)提出依据树状结构图分类的准则: 由 Rk2的定义 可知 , Rk2值越大,也就是Pk/T越小,表示k个类内离差平方和之和Pk在总离差平方和T中占的比例越小,这说明k个类区分得越开. Rk2的值总是在0和1之间,而且Rk2的值总是随着分类个数k的减少而变小 十一、聚类效果评价统计量 所以我们只能取合适的K,使得R2足够大,而K本身较小,且随着K的增加, R2的增幅不大。 1、Rk2统计量 用于评价聚为K个类的效果。如果聚类的效果好,类间的离差平方和相对于类内的离差平方和应比较大,所以应该取伪F统计量较大而类数较小的聚类水平。 2.伪F统计量 其中WK和WL分别是类K、L的类内离差平方和,BKL是将K和L合并为第M类所增加离差平方和 BKL = WM - WK - WL 为合并导致的类内离差平方和的增量。用它评价合并第K和L类的效果,伪 统计量大说明不应该合并这两类,应该取合并前的水平。 3.伪 统计量 §2.5 非系统聚类法简介 动态聚类法:也
您可能关注的文档
- chapter7成本会计7课件.ppt
- Chapter7Packingandmarkingofgoods-副本课件.ppt
- Chapter7流量计课件.ppt
- 愚公移山-修改详解.ppt
- Chapter8全面预算课件.ppt
- chapter8风味(一)食品化学课件.ppt
- chapter9-reliabilitydesignofelectroniccomponents-1课件.ppt
- Chapter2.1.Scanningelectronmicroscopy课件.ppt
- chapter7大气环流课件.ppt
- 愚公移山.详解.ppt
- 2023-2024学年广东省深圳市龙岗区高二(上)期末物理试卷(含答案).pdf
- 2023-2024学年贵州省贵阳市普通中学高一(下)期末物理试卷(含答案).pdf
- 21.《大自然的声音》课件(共45张PPT).pptx
- 2023年江西省吉安市吉安县小升初数学试卷(含答案).pdf
- 2024-2025学年广东省清远市九校联考高一(上)期中物理试卷(含答案).pdf
- 广东省珠海市六校联考2024-2025学年高二上学期11月期中考试语文试题.pdf
- 2024-2025学年语文六年级上册第4单元-单元素养测试(含答案).pdf
- 2024-2025学年重庆八中高三(上)月考物理试卷(10月份)(含答案).pdf
- 安徽省安庆市潜山市北片学校联考2024-2025学年七年级上学期期中生物学试题(含答案).pdf
- 贵州省部分校2024-2025学年九年级上学期期中联考数学试题(含答案).pdf
文档评论(0)