数学建模优秀讲座课件之聚类分析.ppt

数学建模优秀讲座课件之聚类分析.ppt

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

聚类分析的SPSS实现SPSS的实现K-means聚类聚类分析的SPSS实现下一步聚类分析得分类结果显示聚类分析的SPSS实现聚类分析的SPSS实现聚类结果:QCL-1说明聚类结果,QCL-2说明聚类的长度情况聚类分析的分类两步聚类法步骤:Step1:预聚类。对记录进行初始的归类,用户自定义最大类别数。通过构建和修改特征树(CTFree)完成。Step2:正式聚类。对第一步完成的初步聚类进行再聚类并确定最终的聚类方案,系统根据一定的统计标准确定聚类的类别数目。Step3:可以通过传统的聚类方法进行聚类(SPSS中采用合并型分层聚类法)。基本思想:一种探索性的聚类方法,是随着人工智能的发展起来的智能聚类方法中的一种。用于解决海量数据或具有复杂类别结构的聚类分析问题。聚类分析的分类例题:根据已知的啤酒参数对啤酒进行分类聚类分析的SPSS实现标准化之后CompanyLogoLOGO聚类分析主要内容聚类分析概述聚类的相似性度量聚类分析的分类聚类分析的SPSS实现聚类分析概述“物以类聚,人以群分”。定义:聚类是一种数据分析和处理方法,就是按照一定的规律对事物进行区分和分类的过程,它把一个没有类别标记的样本集按某种准则划分成若干个子集(类),使相似的样本尽可能归为一类,而不相似的样本尽量划分到不同的类中。聚类分析是无监督学习聚类分析过程中没有关于类的先验知识,仅靠事物间的相似性作为类属划分的准则。聚类分析的相似性度量距离:主要用于样品(观测)间相似性度量相似系数:主要用于变量间相似性度量如何衡量样本点之间的距离或相似程度?聚类分析的相似性度量常用的距离的计算方法—基本思想设每个样品有p个指标(变量)。把n个样品看成p维空间中的n个点,则两个样品间相似程度就可用p维空间中的两点距离公式来度量。当变量的测量值相差悬殊时,要先进行标准化,以消除计量单位对计算结果的影响。两点距离公式可以从不同角度进行定义。聚类分析的相似性度量欧氏距离—多维空间个点之间的绝对距离常用的距离的计算方法—分类d:特征空间的维数x,y:两个数据对象当较小时,表示x和y在一个类型区域,反之,则不再一个类型区域内聚类分析的相似性度量平方欧氏距离常用的距离的计算方法—分类d:特征空间的维数x,y:两个数据对象当较小时,表示x和y在一个类型区域,反之,则不再一个类型区域内聚类分析的相似性度量切比雪夫距离常用的距离的计算方法—分类d:特征空间的维数x,y:两个数据对象聚类分析的相似性度量马氏距离--数据的协方差距离常用的距离的计算方法—分类:均值向量:协方差矩阵意义:两个服从同一分布并且其协方差矩阵为Σ的随机变量与的差异程度聚类分析的相似性度量常用的距离的计算方法—分类明氏公式是距离公式的通式;:表示欧式公式:表示曼哈坦公式明氏距离特点:第一,它与各指标的量纲有关;第二,它没有考虑指标直接的相关性。聚类分析的相似性度量距离选择的原则一般说来,同一批数据采用不同的距离公式,会得到不同的分类结果。产生不同结果的原因,主要是由于不同的距离公式的侧重点和实际意义都有不同。因此我们在进行聚类分析时,应注意距离公式的选择。通常选择距离公式应注意遵循以下的基本原则:(1)要考虑所选择的距离公式在实际应用中有明确的意义。如欧氏距离就有非常明确的空间距离概念。马氏距离有消除量纲影响的作用。(2)要综合考虑对样本观测数据的预处理和将要采用的聚类分析方法。如在进行聚类分析之前已经对变量作了标准化处理,则通常就可采用欧氏距离。(3)要考虑研究对象的特点和计算量的大小。样品间距离公式的选择是一个比较复杂且带有一定主观性的问题,我们应根据研究对象的特点不同做出具体分折。实际中,聚类分析前不妨试探性地多选择几个距离公式分别进行聚类,然后对聚类分析的结果进行对比分析,以确定最合适的距离测度方法。聚类分析的相似性度量常用的相似系数的计算方法—基本计算变量间的相似性可以从它们的方向趋同性或“相关性”进行考察,“夹角余弦法”和“相关系数”两种主要度量方法,统称为相似系数。(1)夹角余弦*两变量Xi与Xj看作P维空间的两个向量,这两个向量间的余弦夹角可用下式进行计算:聚类分析的相似性度量常用的相似系数的计算方法—基本计算Pearson相关系数经常用来度量变量间的相似性。变量Xi与Xj的Pearson相关系数定义为Pearson相关系数*显然,

文档评论(0)

159****9895 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档