网站大量收购独家精品文档,联系QQ:2885784924

第6章_聚类分析课件.ppt

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6章_聚类分析课件

聚类分析 Cluster Analysis;本章学习目标 ;学习重点、难点 ;问题的提出; 第一节 聚类分析的思想; 1.对象分类 根据分类对象的不同,聚类分析分为二 种一种是对指标(即变量)进行分类,。 叫做 R 型聚类分析,另一种是对样品进行分类,叫做 Q 型聚类分析。 2.方法分类 从聚类所采用的方法上看,又有聚合法、分裂法、图论法等。;第二节 数据变换与分类尺度(标准);1. 正规化变换 就是对任何一个测量因素,把 n 个样品的 值化为[0 , 1] 之间的数据。 变换公式: zij=(xij-mj)/dj (i=1,2 ,…, n ; j=1,2 ,…,k) 其中; 经过上述变换得到与测量单位无关,且 所有数据都在[0,1] 之间的正规化矩阵:; 2. 数据标准化 就是指把每一因素(变量)化为均值为 0 , 方差为 1 的标准化变量具体对( 6-1 )式,即。 是每一列的均值为 0 ,方差为 1 。 变换公式:; 二、分类标准 考察原始观测数据矩阵的元素考查 1. 样品(或变量)距离:;(1)如果把 n 个样品的 k 个指标(变量)看成 k 维空间的 n 个样品点,则样品间的亲疏程度 可用它们相互间的欧氏距离来衡量第 i 个样。 品与第 j 个样品间的距离为:;(2).如果对指标(变量)的聚类,则把 n 个样 品的 k 个指标看成是 n 维空间 k 个点,仿此,得到第 i 个变量与第 j 个变量间的距离为:;2.相似系数 给定原始数据矩阵,把每个样品看成 k 维空间 中的一个向量,此时第 i 个样品向量[xi1 ,xi2,…, xik]与第 j 个向量[ xj1 , xj2, …, xjk]之间的夹角余弦cosθ ij 称为此二样品的相似系数,即;由于-1 ≤ cos θ ij ≤ 1 ,其值越接近于 1 ,说明 二样品的相似程度越高求出两两样品的相。 似系数,得到相似系数矩阵:;仿此作法,把每一个指标(变量)看成是 n 维 空间的向量,可得二变量之间的相似系数:;3.相关系数 相关系数是变量之间线性相关程度的一个量度,常用作变量间相似程度的度量,第 i 个变量与第 j 个变量的相关系数为:;可得变量间相关系数矩阵:;第三节 谱系图的形成 计算出相似统计量后,就可以它为依据对样品(或变量)进行聚类,最后形成谱系图。如下图所示。;Matlab聚类分析;Hierarchical Clustering;clusterdata;Clusterdata示例;逐步过程方法; label={1,2,3,4,5}; scatter(X(:,1),X(:,2)); hold on; text(X(:,1)+0.2,X(:,2),label);;计算点间距离pdist Pairwise distance;计算谱系关系linkage;类间距离的计算方法;类间距离的计算方法;类间距离的计算方法;绘制谱系图;形成聚类cluster;其他中间过程;W = inconsistent(Z,3) W = ;一次形成法;示 例

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档