统计分析-聚类分析.ppt

  1. 1、本文档共54页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
地理数学方法 中科院研究生院资环学院 §10.1 概述 问题的提出 基本思想 主要步骤 基本原则 主要分类 SPSS 软件实现 结果分析-相关系数矩阵 §10.3 系统聚类法 SPSS 软件实现 结果分析-聚类凝聚过程表 §10.3 系统聚类法 Stage 列出步骤序号,Cluster Combined 栏中列出了合 并的两个类的序号,Next stage栏是合并的新类再次出 现的步骤序号。 SPSS 软件实现 结果分析-“Icicle” 冰柱图 §10.3 系统聚类法 SPSS 软件实现 对样本进行聚类 数据标准化方法:离差标准化(Z score法) 点与点间距离的计算:欧氏距离 类与类间距离的计算:“Wards method”离差平方和法 §10.3 系统聚类法 SPSS 软件实现 对样本进行聚类 §10.3 系统聚类法 SPSS 软件实现 对样本进行主成分聚类 主成分提取方法:累积方差贡献率85% (第八章分析结果) 数据标准化方法:离差标准化(Z score法) 点与点间距离的计算:欧氏距离 类与类间距离的计算:“Wards method”离差平方和法 §10.3 系统聚类法 SPSS 软件实现 §10.3 系统聚类法 SPSS 软件实现 对样本进行因子聚类 因子提取方法:主成分法、累积方差贡献率85% 、方差最大正交因子旋转 数据标准化方法:离差标准化(Z score法) 点与点间距离的计算:欧氏距离 类与类间距离的计算:“Wards method”离差平方和法 §10.3 系统聚类法 SPSS 软件实现 对样本进行因子聚类 §10.3 系统聚类法 SPSS 软件实现 §10.3 系统聚类法 CLU3-1是全变量聚类结果;CLU3-2是主成分聚类结果;CLU3-2是因子聚类结果 SPSS 软件实现 §10.3 系统聚类法 Friedman检验表明:全变量聚类结果、主成分聚类 结果、因子聚类结果存在显著性差异 Wilcoxom检验表明:全变量聚类结果与主成分聚类结果、 因子聚类结果存在显著性差异,但主成分与因子聚类结果 无显著性差异。 快速聚类分析的基本思想 在快速聚类过程中,参与聚类分析的变量必须是数值型变量,分类数必须大于等于2,且小于等于观测数。 一般情况下,还指定一个标识变量来标明观测的特征,以便于清楚地表明各观测的所属类。 快速聚类过程始终遵照所有样本空间的点与这几个类中心的距离取最小值原则,进行反复的迭代计算,最终将各个样本分配到各个类中心所在的类,迭代计算将停止。 快速聚类只对样本进行聚类。特别合适大样本聚类。 §10.4 快速聚类法 SPSS 软件实现 §10.4 快速聚类法 SPSS 软件实现 从源变量列表中选择需要聚类分析的变量 选择聚类对象和聚类数 系统默认的聚类数为2 §10.4 快速聚类法 SPSS 软件实现 从源变量列表中选择需要聚类分析的变量 选择聚类方法 Iterate and classify:表示在迭代过程中不断地更新聚类中心; Classify only: 表示用初始聚类中心对观测量进行聚类,聚类中心不变 §10.4 快速聚类法 SPSS 软件实现 从源变量列表中选择需要聚类分析的变量 选择聚类方法 Read initial from: 用来指定数据文件来源,表明所分析的作为凝聚点的观测来自哪一个文件; Write final as: 用来把聚类过程凝聚点的最终结果保存到指定的数据文件里。 §10.4 快速聚类法 * * §10 聚类分析(Cluster Analysis) [引例10-1] §10 聚类分析(Cluster Analysis) [引例10-1] §10 聚类分析(Cluster Analysis) §10.1 概述 §10.2 统计量 §10.3 系统聚类(层次聚类) §10.4 快速聚类 §10.1 概述 §10.1 概述 问题的提出 聚类分析又称群分析、点群分析、簇群分析等,是研究分类问题(样本或指标)的一种多元统计方法。 与其它多元统计分析方法相比,聚类分析方法比较粗糙,理论上尚不完善,目前正处于发展阶段。 但由于这种方法能解决许多实际问题,应用比较方便,因此越来越受到人们的重视。 §10.1 概述 问题的提出 基本思想 假定研究对象之间存在不同程度的相似性(亲疏程度)。 根据观测样本,找出并计算一些能够度量相似程度的统计量(相似系数、相关系数、距离等)。 按照相似性统计量,将相似程度大的聚合到一类,关系疏远的聚合到另一类,直到把所有样本都聚合完毕,形成一个由小到大的分类系统。

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档