- 1、本文档共21页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十一章 聚类分析Chap. XI Clustering Analysis 第二节 系统聚类方法(Cluster) 第十一章 聚类分析Chap. XI Clustering Analysis 第一节 聚类分析的一些基本概念Basic Concepts of Clustering Analysis 第一节 聚类分析的一些基本概念Basic Concepts of Clustering Analysis 第一节 聚类分析的一些基本概念Basic Concepts of Clustering Analysis 第一节 聚类分析的一些基本概念Basic Concepts of Clustering Analysis 第一节 聚类分析的一些基本概念Basic Concepts of Clustering Analysis 第一节 聚类分析的一些基本概念Basic Concepts of Clustering Analysis 第一节 聚类分析的一些基本概念Basic Concepts of Clustering Analysis 第一节 聚类分析的一些基本概念Basic Concepts of Clustering Analysis 第二节 系统聚类方法Hierarchical Clustering Methods 第二节 系统聚类方法Hierarchical Clustering Methods 第二节 系统聚类方法Hierarchical Clustering Methods 第二节 系统聚类方法Hierarchical Clustering Methods 第二节 系统聚类方法Hierarchical Clustering Methods 第二节 系统聚类方法Hierarchical Clustering Methods 第三节 动态聚类方法Dynamic Clustering Methods 第三节 动态聚类方法Dynamic Clustering Methods 第四节 变量聚类法(VarClus) 第四节 变量聚类法(VarClus) * 第一节 聚类分析的一些基本概念 第三节 动态聚类方法(FastClus) 第四节 变量聚类法(VarClus) 聚类分析是一种应用变量的数值特征来对研究对象进行分类的非常有用的统计分析方法。 以往,人们对研究对象的分类(例如将植物分为不同的门、纲、目、科、属、种)大都只凭这些研究对象的直观形态描述来进行。但随着分类工作变得更细致时,往往要求从数值上进行考虑。这时需要用到聚类分析方法。 物以类聚,人以群分——朴素的聚类分析思想。肿瘤病症的分类、大气污染的轻重、学习成绩的分几等以及社会经济发展状况的分类等等。 聚类分析就是按研究的目的根据研究对象的某些数 量特征把观察对象分成若干类型的方法。 分配在同一类内的观察对象应相对地互相相似(或 互相接近),而分配在不同类的观察对象应相对地 不那么相似。 分类的结果强烈地依赖于所收集到的性状,而收集 的性状又强烈地依赖于研究者的选择。 此外对于同样一套数据资料,使用不同的方法进行 分类,其划分结果也会有所不同。 很难用一种通用的数学方法来确定那种方法最好, 那种方法不好。 但可以比较不同方法得到的划分结果,即可以从实践 的角度来确定那个分类结果比较合理,那个分类结果 不那么理想。 本章拟将应用得较广的聚类分析方法逐一介绍,让大 家能用多种方法来对自己的数据进行分析,并从中选 出比较合理的分析结果。 分类对象和分类依据 例1 收集了10个学生8门课程的学习成绩,如下表 所示。按一般习惯,我们称学生为观测事例,称课 程为变量。于是现在有10个事例,8个变量的观察值, 或称为十组观察值。 对于聚类分析,可能有两种分类的目的: 21 32 36 18 31 25 18 20 极差 70 60 53 70 64 66 63 69 最低分数 28.21 100.64 107.76 36.76 71.25 51.45 31.09 39.16 总体方差 平均 82.3 71.4 70.2 80.2 76.5 81.5 70.9 79.2 平均分数 70.500 81 67 60 75 71 66 66 78 张汉威 10 74.375 85 77 61 72 64 87 68 81 周而复 9 76.625 83 83 73 83 69 82 67 73 孙自强 8 80.375 85 67 76 86 85 80 75 89 许东立 7 74.500 77 74 76 76 71 80 73 69 吴勇仁 6 68.0
文档评论(0)