[教育学]第7章-聚类分析.pptVIP

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
6. 伪t 2 统计量 伪t2 值大表示GK 和GL 合并成新类GM 后,类内离差平方和的增量相对于原GK 和GL 两类的类内的离差平方和是大的,这说明原GK 和GL 两类是很分开的,即上一次聚类的效果是好的。伪 t 2 统计量不具有随机变量 t 2 那样的分布。 十一、系统聚类法的基本性质 1. 单调性 在聚类分析过程中,并类距离分别为Dk(k=1,2,3,…?)若满足 ,则称该聚类方法具有单调性。可以证明除了重心法和中间距离法之外,其他的系统聚类法均满足单调性的条件。 2. 空间的浓缩与扩张 十二、小结 系统聚类法是一种比较成功的聚类方法。然而当样本点数量十分庞大时,则是一件非常繁重的工作,且聚类的计算速度也比较慢。比如在市场抽样调查中,有4万人就其对衣着的偏好作了回答,希望能迅速将他们分为几类。这时,采用系统聚类法就很困难,而动态聚类法就会显得方便,适用。 第四节 动态聚类法 一、基本思想 选择凝聚点 分 类 修改分类 分类是否合理 分类结束 Yes No * 多元统计分析 ? 谢中华, 天津科技大学数学系. 第三节 系统聚类方法 类与类之间用不同的方法定义距离,就产生了不同的系统聚类方法。 开始时将n个样品各自作为一类,并规定样品之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类,计算新类与其它类之间的距离,重复进行两个最近类的合并,每次减少一类,直至所有的样品合并为一类。 一、基本思想 x21? x12? x22? x11? 二、 最短距离法(single linkage method) 例7.3.1 设有五个样品,每个只测量了一个指标,指标值分别是1,2,6,8,11. 在用最短距离法对这五个样品进行聚类时,样品间采用绝对值距离,现已得到样品间初始距离矩阵 如下 G5 G4 G3 G2 G1 0 G1 0 1 G2 0 3 0 5 2 9 10 G5 6 7 G4 0 4 5 G3 试根据以上结果完成下面的聚类过程,将五个样品聚为一类。 data exam7_3_1_1; input v $ x; cards; x1 1 x2 2 x3 6 x4 8 x5 11 ; proc cluster method=sin; var x; id v; proc tree horizontal=1; id v; run; SAS程序1 data exam7_3_1_2(type=distance); array x(5)x1-x5; input v $ x1-x5; cards; x1 0 . . . . x2 1 0 . . . x3 5 4 0 . . x4 7 6 2 0 . x5 10 9 5 3 0 ; proc cluster method=sin; var x1-x5; id v; proc tree horizontal; id v; run; SAS程序2 聚类树形(谱系)图 ? ? ? x11? x21? ? ? ? 三、 最长距离法(Complete linkage method) 例7.3.2 对305名女中学生测量八个体型指标: x1= 身高, x5= 体重, x2= 手臂长, x6= 颈围, x3= 上肢长, x7= 胸围, x4= 下肢长, x8= 胸宽, 相关矩阵列于下表 0.629 0.730 0.762 1.000 . . . . x5 0.539 1.000 . . . . . . x7 0.382 0.301 0.398 0.473 0.859 0.805 0.846 1.000 x1 . 0.583 0.327 0.237 0.277 x7 . 1.000 0.329 0.319 0.326 x6 . . 0.436 0.380 0.376 x5 x8 x6 x4 x3 x2 . . . . . x1 . . . . 1.000 x2 1.000 . 0.577 . . 0.365 1.000 0.345 0.415 x8 0.801 0.826 x4 . 1.000 0.881 x3 应用最长距离法进行聚类,即类与类之间的相似系数定义为两类变量之间的最小相关系数。每次聚类时合并两个相关系数最大的类。 data examp7_3_2(type=distance); array x(8)

您可能关注的文档

文档评论(0)

ma982890 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档