网站大量收购闲置独家精品文档,联系QQ:2885784924

聚类分析-07.pptVIP

  1. 1、本文档共67页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚类分析-07ppt课件

第十九章 聚类分析 (Cluster Analysis) 古语: “物以类聚”,找出特征相似的类别,研究其规律性。 本章的内容 第一节 相似系数* 第二节 系统聚类* 第三节 动态样品聚类* 第四节 有序样品聚类 第五节 应用注意事项* 重点:掌握聚类分析用途、概念、方法的区别、注意问题。 概 述 聚类分析是将未知现象进行归类的多元统计方法 。 主要用途: 对研究的事物分类或做探索性的研究。 目的: 通过分类,找出同类的共性和不同类的差异,为决策提供参考. 聚类分析 聚类对象的类型: R型聚类:对n个指标(变量或variable )归类(index-cluster-analysis)。 Q型聚类:对n个观察对象(样品或case)归类(samples-cluster-analysis)。 例:中医证型研究 对临床症状分类(指标聚类) 2002年中国部分省市国民经济数据 聚类方法 根据分类样品(变量)的多少及特点。 方法: 系统(层次)聚类---(例数少)* 动态样品聚类---(例数多)* 有序聚类--(样品在时间和空间有自然顺序) 神经网络的聚类---(自动确定类别) * SPSS和SAS软件可得到. 聚类分析基本思想与步骤 思想: 根据指标和样品的相似性. 步骤: 1.计算描述样品(变量)间相似性的指标:用距离系数或相关系数. 2.根据相似性对样品(变量)归类. 方法:有多种聚类方法 第一节 相似系数 意义:用相似系数度量指标和样品间的相似程度. 1.指标(变量)间的相似系数: ①变量为计量数据 相关系数(r) (19-1) ②变量为计数数据(等级或两分类) 列连系数(C) (19-2) 2.个体(样品)间的相似系数 用个体间某变量(x)的距离(dij)表示: 欧氏距离:(Euclidean distance) 绝对距离: 第二节 系统聚类(层次聚类) (hierarchical clustering) 步骤如下: 1.将每个变量(样品)各视为一类. 2.将相似系数最大(距离最小)的两类合并新类, 计算新类与其他类的类间相似系数. 3.重复第2步过程,直到全部合并为一类. 4.结果:得到聚类的树状图。 系统聚类(对变量聚类) 1.计算变量间的两两相似系数(r) 并认为各变量各为一类,即G1,G2,G3,G4。 系统聚类类间相似系数计算 当聚类的两类变量(样品)各只含一个变量时, 如G1,G2, 两类间的类间相似系数为 rij或dij。 当聚类两类变量(样品)含有两个变量时,两类间的类间相似系数的计算有讲义5种。 类间相似系数的计算 (讲义401页) 聚类的方法 最大相似系数法 最小距离法 重心法 类平均法 离差平方和法 统计软件有11种方法,但基本思想一致. 最大相似系数法(401页) 最大相似系数法聚类方法 2.计算新类(G5)与G3、 G4的类间相似系数,进行合并,得到R1距阵. 3.根据最大相似系数法, 组成合并后相似系数距阵(R1) 例19-1的聚类过程 步 合并类别 相关系数 新类命名 类内指标 1 G1G2 0.875 G5 1,2 2 G3G4 0.732 G6 3,4 3. G5G6 0.234 G7 1,2,3,4 例19-2 样品聚类(表19-1) 6个运动员4个运动项目的测定值(均数) 运动 能耗(x1) 糖耗(x2) x1‘

文档评论(0)

118zhuanqian + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档