- 1、本文档共41页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
K-means快速聚类 (二)思路 SPSS中两个判断聚类是否结束的条件,满足其中一个即可结束聚类过程. 达到指定迭代次数(maximum iteration),默认10次。 收敛标准(convergence),默认0.02(显示0),即:本次迭代产生的任意新类,各中心位置变化较小.其中最大的变化率小于2%. K-means快速聚类 (三)基本操作步骤 A.菜单选项:analyze-classify-k means cluster B.选定参加快速聚类分析的变量到variables框 C.确定快速聚类的类数(number of clusters).类数应小于个案总数 D.选择聚类方法(method):默认iterate and classify,即:在聚类的每一步都重新计算新的类中心 E.确定聚类终止条件(iterate) K-means快速聚类 (四)其他 1. 保存快速聚类的结果(save) cluster membership:将各个案所属类的类号保存到qcl_1变量中 distance from cluster center:将各样本距所属类中心的距离保存到qcl_2变量中. K-means快速聚类 (四)其他 2.输出选项(option) initial cluster centers:输出初始类中心点 ANOVA table:输出各类的方差分析表 cluster information for each case:输出每个样本的分类结果和距离 K-means快速聚类 (四)其他 3. use running means项: 选中:表示每个样本被分配到一类后立即计算新的类中心。聚类结果与个案的先后次序有关. 不选中:表示完成了所有个案的依次分配后再计算类中心。省时。 K-means快速聚类 (四)其他 4.用户指定类中心(center) read initial from:若不指定则系统自动确定初始类中心。指定则从某.sav文件中读入初始类中心数据(应设一个名为Cluster_的变量名)。 Write final as:在分析的最后将各类中心写入某.sav文件 聚类分析其他 (一)聚类解的可信性(一般性) 如果一个聚类解重复出现在从同一总体抽出的不同样本中,则以认为该聚类解具有可信性 样本分成两组分别聚类比较. 对同一批数据采用不同的方法反复聚类 聚类分析其他 (二)聚类方法的选择 没有明确答案 层次聚类方法易受异常值的影响.应尽量剔除异常值对聚类结果的影响 快速聚类方法受异常值的影响较小,对不合适的初始分类能够迭代调整 两种聚类方法结合使用. 通过小规模分层聚类确定分类数目,为快速聚类提供帮助; 通过反复的分层聚类,发现并排除异常值; 通过快速聚类进行大规模聚类 某电信公司电话流向聚类 第一类:省内长途,业务量最大 第二类:与该地区业务来往较多的省份。 北京:首都 湖南:地缘、人缘相接 重庆:人员交流多 第三类:与该地区业务来往仅次于第二类 第四类:业务来往少的省区 人有了知识,就会具备各种分析能力, 明辨是非的能力。 所以我们要勤恳读书,广泛阅读, 古人说“书中自有黄金屋。 ”通过阅读科技书籍,我们能丰富知识, 培养逻辑思维能力; 通过阅读文学作品,我们能提高文学鉴赏水平, 培养文学情趣; 通过阅读报刊,我们能增长见识,扩大自己的知识面。 有许多书籍还能培养我们的道德情操, 给我们巨大的精神力量, 鼓舞我们前进。 * * * 1 - * 1 - * 第八章 SPSS的聚类分析 聚类分析概述 (一)概念 (1)聚类分析是统计学中研究“物以类聚”的一种方法,属多元统计分析方法. 例如:细分市场、消费行为划分 聚类分析是建立一种分类,是将一批样本(或变量)按照在性质上的“亲疏”程度,在没有先验知识的情况下自动进行分类的方法.其中:类内个体具有较高的相似性,类间的差异性较大. 聚类分析概述 两类:(001 002) (003 004 005) 三类:(001 002) (003) (004 005) (2)例如 聚类分析概述 (3)总结 上述分类的原则:依据学生成绩的差距,差距较小的为一类 分类过程中,没有事先指定分类的标准.完全根据样本数据客观产生分类结果. (4)SPSS中的聚类方法 分层聚类 K-MEANS快速聚类 聚类分析概述 (二)特点 聚类分析前所有个体所属的类别是未知的,类别个数一般也是未知的,分析的依据只有原始数据,可能事先没有任何有关类别的信息可参考 严格地,聚类分析并不是纯粹的统计技术,不象其他多元分析,需要从样本去推断总体 一般不涉及统计量分布,也不需显著性检验 聚类分析更象是一种建立假设的方法,而对相关假设的检验还需要借助其他统计方法 聚类分析概述 (三)注意 聚类分析主要用于探索性研
您可能关注的文档
- 第九章_有毒动植物试卷.ppt
- 电流做功与什么因素有关教程.ppt
- 第九章_债券久期的基本概念试卷.ppt
- 第九章_重要健康问题的健康教育试卷.ppt
- 第二章-杆和梁结构的有限元法试卷.ppt
- 第九章+财政平衡试卷.ppt
- 第六章砂浆试卷.ppt
- 第二章刚体静力基础试卷.ppt
- 第二章钢结构试卷.ppt
- 第二章钢筋和混凝土的力学性能试卷.ppt
- 2024年江西省高考政治试卷真题(含答案逐题解析).pdf
- 2025年四川省新高考八省适应性联考模拟演练(二)物理试卷(含答案详解).pdf
- 2025年四川省新高考八省适应性联考模拟演练(二)地理试卷(含答案详解).pdf
- 2024年内蒙通辽市中考化学试卷(含答案逐题解析).docx
- 2024年四川省攀枝花市中考化学试卷真题(含答案详解).docx
- (一模)长春市2025届高三质量监测(一)化学试卷(含答案).pdf
- 2024年安徽省高考政治试卷(含答案逐题解析).pdf
- (一模)长春市2025届高三质量监测(一)生物试卷(含答案).pdf
- 2024年湖南省高考政治试卷真题(含答案逐题解析).docx
- 2024年安徽省高考政治试卷(含答案逐题解析).docx
最近下载
- 2022年新高考全国Ⅰ卷英语真题.docx VIP
- 《0-3岁婴幼儿身心发展与教养》PPT教学课件.pptx VIP
- 《0-3岁婴幼儿身心发展与教养》课件06婴幼儿语言的发展及教养.pptx VIP
- 护士生涯人物访谈 .pdf VIP
- 体育职业生涯规划书课件.pptx VIP
- AB SCIEX 6500 质谱系统在食品安全中的应用.pptx VIP
- 《0-3岁婴幼儿身心发展与教养》课件05婴幼儿记忆的发展及教养.pptx VIP
- C-Primer-Plus第六版中文版习题答案.doc
- 《0-3岁婴幼儿身心发展与教养》课件09婴幼儿意志的发展及教养.docx VIP
- 新能源学生职业生涯规划与管理.pptx VIP
文档评论(0)