203年8月9日建模---聚类分析.pptVIP

下载本文档

7
0
约9.99千字
约 109页
2017-02-09 发布于上海
举报
版权申诉

203年8月9日建模---聚类分析.ppt

1、本文档共109页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

203年8月9日建模---聚类分析

SPSS 16实用教程第10章聚类分析实验步骤：（1）菜单选项：Statistics-Classify-Hierachical Cluster. (2)选择参与层次聚类分析的变量到Variables框中。 (3)选择一个字符型变量作为样本的标记变量到label Cases框中选择标记变量将大大增强聚类分析结果的可读性。（4）选择作R型聚类还是作Q聚类。系统默认作Q聚类。（5）按Method 按钮选择距离计算方法。其中：Cluster下拉框中给出的计算类间距离的方法，SPSS 默认的是组间平均链锁法；Measure框中给出的计算样本距离的方法，Interval适用于连续型变量，SPSS默认计算欧式距离平方；Counts适用于顺序水准或名义水准的变量，SPSS默认计算卡方统计量，Binary 适用于二值变量，SPSS默认计算二元欧式距离平方。图10-8 层次聚类分析结果保存 10.3 层次聚类分析中的R型聚类 10.3.1 统计学上的定义和计算公式定义：层次聚类分析中的R型聚类是对研究对象的观察变量进行分类，它使具有共同特征的变量聚在一起。以便可以从不同类中分别选出具有代表性的变量作分析，从而减少分析变量的个数。计算公式：R型聚类的计算公式和Q型聚类的计算公式是类似的，不同的是R型聚类是对变量间进行距离的计算，Q型聚类则是对样本间进行距离的计算。 ? 研究问题对一个班同学的各科成绩进行聚类，分析哪些课程是属于一个类的。聚类的依据是4门功课的考试成绩，数据如表10-2所示。 10.3.2 SPSS中实现过程表10-2 学生的四门课程的成绩 84.00 85.00 100.00 100.00 Iiakii 90.00 89.00 56.00 60.00 wish 89.00 88.00 76.00 75.00 jess 51.00 50.00 87.00 79.00 watet 88.00 85.00 65.00 60.00 john 96.00 95.00 78.00 75.00 hah 82.00 81.00 78.00 89.00 shizg 97.00 95.00 80.00 79.00 yu 90.00 89.00 89.00 88.00 yaju 80.00 78.00 98.00 99.00 hxh 政治语文物理数学姓名 ? 实现步骤图10-9 在菜单中选择“Hierarchical Cluster”命令图10-10 “Hierarchical Cluster Analysis”对话框（二）图10-11 “Hierarchical Cluster Analysis：Method”对话框（二）图10-12 “Hierarchical Cluster Analysis：Plots”对话框（二）图10-13 “Hierarchical Cluster Analysis：Statistics”对话框（二）（1）首先是层次R型聚类分析的结果，该结果是SPSS输出结果文件中的第一个表格。 10.3.3 结果和讨论（2）输出的结果文件中第二个表格如下表所示。（3）输出的结果文件中第三个表格如下表所示。（4）输出的结果文件中第四个表格如下表所示。（5）输出的结果文件中第五个表格如下表所示。（4）类内平均链锁法（Within-groups Linkage）与小类间平均链锁法类似，这里的平均距离是对所有样本对的距离求平均值，包括小类之间的样本对、小类内的样本对。（5）重心法（Centroid Clustering）将两小类间的距离定义成两小类重心间的距离。每一小类的重心就是该类中所有样本在各个变量上的均值代表点。（6）离差平方和法（Ward’s Method）小类合并的方法：在聚类过程中，使小类内各个样本的欧氏距离总平方和增加最小的两小类合并成一类。系统聚类过程系统聚类过程的基本步骤如下： 1.建立或打开需进行聚类分析的数据文件。 2.执行Analysis→Classify→Hierarchical cluster 命令，打开Hierarchical Cluster Analysis（系统聚类分析）主对话框，如下图所示)。 (1)从源变量列表中需进行聚类分析的变量移入Variable(s)框中。 (2)选择一个字符型标记变量移入Label case by 框中。 (3)在Cluster 栏中选择聚类分析类型： l????? Case:计算观测量之间的距离，进行样本聚类。 l???