网站大量收购独家精品文档,联系QQ:2885784924
  1. 1、本文档共27页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基本原理 聚类分析的分类 聚类分析在SPSS中的实现过程 分析例子 聚类分析分类 按分类对象不同:分为Q-型聚类分析(对样本分类)和R-型聚类分析(对指标或变量分类) 聚类分析分类 按分类方法不同:系统聚类法(分层聚类法-Hierarchical Cluster)将指标或样品各视为一类,根据类与类之间的距离或相似程度将最相似的类加以合并,再计算新类与其他类之间的相似程度,并选择最相似的类加以合并。 动态聚类法(快速聚类分析或K-均值聚类法K-means Cluster)开始按照一定方法选取一批聚类中心,让样品向最近的聚心凝聚,形成初始分类,然后按最近距离原则不断修改不合理分类,直到合理为止。 * * 聚类分析 聚类分析 聚类分析的基本原理 科学研究在揭示对象特点及其相互作用的过程中, 需要对其进行分类 ,以揭示其中相同和不相同的特征。 在科学研究中, 经常遇到的分类包括两种情况: 一是对研究样本的分类, 即根据每个样本的一系列观测指标,将那些在这些观测量方面表现相近的样本归为一类, 将那些在这些观测量方面的表现很不相同的样本归为不同类。 二是对观测指标的分类,即将一系列的观测指标归类合并为性质明显不同的少数几个方面。 一、聚类分析的基本原理 聚类分析的基本原理 聚类分析是一种数值分类方法,直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。 聚类分析完全是根据数据情况来进行的。就一个由n个个案、k个变量组成的数据文件来说 ,当对个案进行聚类分析时,相当于对k 维坐标系中的n 个点进行分组,所依据的是它们的距离 ; 当对变量进行聚类分析时,相当于对n维坐标系中的k个点进行分组,所依据的也是点距。所以距离或相似性程度是聚类分析的基础。 点距如何计算呢?拿连续测量的变量来说,可以用欧氏距离平方计算:即各变量差值的平方和。 聚类分析的分类 聚类分析的分类 聚类分析的分类 二、Q聚类分析的SPSS过程 第一步:数据文件的准备。 聚类之前的数据文件包括:n个样本的k个观测值。 此外还需要一个样本的标识变量。 聚类分析前要检查各变量的量纲是否一致, 不一致则需进行转换, 如将各变量均作标准化转换就可保证量纲一致 Q型聚类分析在SPSS中的实现过程 第二步:点击“Analyze”菜单选中“Classify”的“Hierarchical Cluster Analysis”,打开对话框。将参与聚类分析的观测变量 置入“Variable(s)”下的方框中,将样本标识变量的变量名置 入 “Label Cases By” 下的方框中,同时在 Cluster 之下选择 Cases。然后选中“Statistics”和“Plots”。 Q型聚类分析在SPSS中的实现过程 第三步:点击“Method”打开聚类分析的距离计算方法设置对 话框 ,以实现对小类间距离 、样本间距离计算方法的设置 , 同时对量纲不一致情况下的变量观测值进行转换: (1) 小类间距离计算:默认方式是类间平均链锁法(Between- Groups linkage) ,这种方法最充分地使用了数据资料; (2) 样本间距离计算: 观测变量为连续变量,默认方法:欧氏距离平方; 观测变量为顺序或名义变量,默认方法:卡方测量方法; 观测变量为二项选择变量, 默认方法:二元欧氏距离平方。 (3) 如果观测变量的量纲不一致,还需设置对不同量纲变量进 标准化处理。默认状态是“none”,需要时可以选择“Z-scores”, 这是使用最广泛、最直观的转换方法 。在进行量纲转换时 , 要选择“By cases”表明是属于Q聚类分析中的量纲转换。 第四步:指定图形输出。层次聚类分析的图形结果有两种形 式(1)树形图(Dendrogram),它可以展现聚类分析的每一 次合并过程,SPSS首先将各类之间的距离重新转换到 0~25 之间 ,然后表现在图上 。此图可以粗略地表现聚类的过程 ; (2)冰柱图(Icicle), 包括纵向冰柱图(Vertical) 和横向 冰柱图(Horizontal) 。冰柱图用X符号来表示聚类过程 , 其选 择包括:全部、部分、无。 Q型聚类分析在SPSS中的实现过程 第五步:显示凝聚状态表。点击层次聚类分析对话框中的 “statistics”可以打开设置凝聚状态对话框。 (1) 选中“Agglomeration schedule”,可以输出聚类分析 详细过程,即每一阶段完成的是哪些个案或小类间的聚集; (2)

文档评论(0)

tiangou + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档