计量统计方法2节.ppt

  1. 1、本文档共115页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
4 聚类分析 Step-1:将数据导入SPSS中,选用层次聚类法进行聚类分析:Analyze-Classify-Hierarchical Cluster; Step-2:进入层次聚类分析对话框,设置聚类变量,以及采用的聚类方法,是否显示聚类谱系图等。 4 聚类分析 Step-3:点击“Plot”按钮,勾选“Demdrogram”,显示聚类谱系图。 Step-4:点击“Method”按钮,在弹出的对话框中可以选择用以聚类分析的方法,这里选择“Nearest Neighbor”(最近距离法)。 4 聚类分析 SPSS层次聚类分析参数说明: Cluster(聚类对象): Cases(观测值聚类) / Variables (变量聚类) Statistics(统计量): Agglomeration schedule 凝聚法过程 Proximty matrix 欧式不相似系数平方矩阵 Plot(绘图): Demdrogram 聚类结果谱系图 4 聚类分析 SPSS层次聚类分析参数说明: Cluster Method(聚类方法): 1.Between-groups linkage: 类间平均链锁 2.Within-groups linkage: 类内平均链锁 3.Nearest neighbor: 最短距离法 4.Furthest neighbor: 最远距离法 5.Centroid clustering: 重心法 6.Median clustering: 中间距离法 7.Wards method: 离差平方和法 4 聚类分析 SPSS层次聚类分析参数说明: Interval(距离测算): 1.Euclidean distance: 欧氏距离 2.Squared Euclidean distance: 欧氏距离平方 3.Cosine: 变量矢量的余弦 4.Pearson correlation: 相关系数距离 5.Chebychev: 切比雪夫距离 6.Block: City-Block或Manhattan距离 7.Minkowski: 明科夫斯基距离 8.Customized: 用户自定义距离测算 4 聚类分析 聚类结果-1: 聚类分析概要,包括观测值说明和采用的距离测算方法等。 4 聚类分析 聚类结果-2: 聚类过程 4 聚类分析 聚类结果-3: 聚类结果谱系图 4 聚类分析 例4-8:直接调用Matlab函数实现层次聚类法。 层次聚类法(Hierarchical Clustering)计算步骤: ①计算n个样本两两间的距离{dij},记D ②构造n个类,每个类只包含一个样本; ③合并距离最近的两类为一新类; ④计算新类与当前各类的距离;若类的个数等于1,转到⑤ ;否则回③ ; ⑤画聚类图; ⑥决定类的个数和类; 4 聚类分析 调用的Matlab函数说明: cluster 从连接输出(linkage)中创建聚类 clusterdata 从数据集合(x)中创建聚类 dendrogram 画系统树状图 linkage 连接数据集中的目标为二元群的层次树 pdist 计算数据集合中两两元素间的距离(向量) squareform 将距离的输出向量形式定格为矩阵形式 zscore 对数据矩阵 X 进行标准化处理 4 聚类分析 程序清单: %最短距离法系统聚类分析 X=[7.90 39.77 8.49 12.94 19.27 11.05 2.04 13.29; 7.68 50.37 11.35 13.3 19.25 14.59 2.75 14.87; 9.42 27.93 8.20 8.14 16.17 9.42 1.55 9.76; 9.16 27.98 9.01 9.32 15.99 9.10 1.82 11.35; 10.06 28.64 10.52 10.05 16.18 8.39 1.96 10.81]; BX=zscore(X); % 标准化数据矩阵 Y=pdist(X) % 用欧氏距离计算两两之间的距离 D=squareform(Y) % 欧氏距离矩阵 Z = linkage(Y) % 最短距离法 T = cluster(Z,3) % 等价于 { T=clusterdata(X,3) } find(T==3) % 第3类集合中的元素 [H,T]=dendrogram(Z) % 画聚类图 4 聚类分析 原始数据(5*8): 欧氏距离矩阵: 4 聚类分析 聚类结果谱系图 4 聚类分析 例4-9:利用Matlab实现最短距离聚类分析。

文档评论(0)

精品课件 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档