系统工程3_2.聚类分析.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
系统聚类法 系统聚类法是聚类分析诸方法中用得最多的一种。 基本思想:开始将个样品各自作为一类,并规定样品之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类,计算新类与其他类的距离;重复进行两个最近类的合并,每次减少一类,直至所有的样品合并为一类。 常用的系统聚类方法: 最短距离法 最长举例法 中间举例法 重心法 系统聚类法基本步骤 1. 选择样本间距离的定义及类间距离的定义; 2. 计算n个样本两两之间的距离,得到距离矩阵 3. 构造个类,每类只含有一个样本; 4. 合并符合类间距离定义要求的两类为一个新类; 5. 计算新类与当前各类的距离。若类的个数为1,则转到步骤6,否则回到步骤4; 6.画出聚类图; 7.决定类的个数和类。 根据5个省区之间的欧式距离,用D0表示距离矩阵(对称阵,故给出下三角阵) 因此将3.4合并为一类,为类6,替代了3、4两类 类6与剩余的1、2、5之间的距离分别为: d(3,4)1=min(d31,d41)=min(13.80,13.12)=13.12 d(3,4)2=min(d32,d42)=min(24.63,24.06)=24.06 d(3,4)5=min(d35,d45)=min(3.51,2.21)=2.21 得到新矩阵 合并类6和类5,得到新类7 类7与剩余的1、2之间的距离分别为: d(5,6)1=min(d51,d61)=min(12.80,13.12)=12.80 d(5,6)2=min(d52,d62)=min(23.54,24.06)=23.54 得到新矩阵 合并类1和类2,得到新类8 此时,我们有两个不同的类:类7和类8。 它们的最近距离 d(7,8) =min(d71,d72)=min(12.80,23.54)=12.80 得到矩阵 最后合并为一个大类。这就是按最短距离定义类间距离的系统聚类方法。最长距离法类似! “备”则“倍” 有准备、有规划的人生更精彩! 例: 为了研究辽宁等5省1991年城镇居民生活消费的分布规律,根据调查资料做类型分类,用最短距离做类间分类。资料如下: 省份 x1 x2 x3 x4 x5 x6 x7 x8 辽宁 7.90 39.77 8.49 12.94 19.27 11.05 2.04 13.29 浙江 7.68 50.37 11.35 13.30 19.25 14.59 2.75 14.87 河南 9.42 27.93 8.20 8.14 16.17 9.42 1.55 9.76 甘肃 9.16 27.98 9.01 9.32 15.99 9.10 1.82 11.35 青海 10.06 28.64 10.52 10.05 16.18 8.39 1.96 10.81 将每一个省区视为一个样本: G1={辽宁},G2={浙江},G3={河南},G4={甘肃},G5={青海} 采用欧氏距离: d12 =[(7.9-7.68)2+(39.77-50.37)2+(8.49-11.35)2+(12.94- 13.3)2+(19.27-19.25)2+(11.05-14.59)2+(2.04-2.75)2+(13.29-14.87)2]0.5=11.67 d13=13.80 d14=13.12 d15=12.80 d23=24.63 d24=24.06 d25=23.54 d34=2.2 d35=3.51 d45=2.21 上述聚类过程可以画出一种树形图(谱系图,dendrogram): 1.正确认识自我,尊重自我——人职和谐的基础 2.充分了解职场,努力做到人职匹配 3.适应社会需求与发展,选择最能发挥自己能力特长的职业。 没有最好的职业,只有最适合自己的职业,适合自己的才是最好的。 1.职业生涯开发与管理的观点是:只要开始,永远不晚; 只要进步,总有空间。 2.在职业生涯的道路上,重要的不是目前所处的位置, 而是迈出下一步的方向。 3-2 聚类分析 Cluster Analysis 什么是聚类分析 聚类分析是根据“物以类聚”的道理,对样品(观测量)或指标(变量)进行分类的一种多元统计分析方法。 将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。 聚类分析的目的: 使类内对象的同质性最大化和类间对象的异质性最大化。 原则是同一类中的个体有较大的相似性,不同类中的个体差异很大。 聚类分析的应用:无处不在 早在孩提时代,人就通过不断改进下意识中的聚类模式来学会如何区分猫和狗,动物和植物 谁经常光顾商店,谁买什么东西,买多少? 按忠诚卡记录

文档评论(0)

liyxi26 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档