聚类分析在SAS中的实现课件.ppt

聚类分析在SAS中的实现课件.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共32页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

聚类分析;主要内容;概述;基本程序是根据一批样品的多个观测指标,具体地找出一些能够度量样品或指标之间相似程度的统计量,然后利用统计量将样品或指标进行归类。

具体进行聚类时,由于目的、要求不同,因而产生各种不同的聚类方法:;举例对上市公司的经营业绩进行分类;据经济信息和市场行情,客观地对不同商品、不同用户及时地进行分类。又例如当我们对企业的经济效益进行评价时,建立了一个由多个指标组成的指标体系,由于信息的重叠,一些指标之间存在很强的相关性,所以需要将相似的指标聚为一类,从而达到简化指标体系的目的。;按照聚类分析分组依据的原则不同分组

按照聚类分析的对象不同分组

;系统聚类分析法在样品距离的基础上定义类与类的距离,首先将各个样品自成一类,然后每次将具有最小距离的两个类合并,合并后再重新计算类与类之间的距离,再并类,这个过程一直持续到所有的样品都归为一类为止。这种聚类方法称为系统聚类法。根据并类过程所做的样品聚类过程图称为聚类谱系图。

;图论聚类法利用图论中最小支撑树(MST)的概念来处理分类问题,是一种独具风格的方法。

聚类预报法利用聚类方法处理预报问题,主要是处理一些异常数据,如气象中的灾害性天气的预报,这些异常数据采用回归分析或判别分析处理的效果不好,而聚类预报可以弥补回归分析及判别分析方法之不足,是一个很值得重视的方法。;R型聚类分析法对变量进行的分类处理。

作用

①了解变量之间,以及变量组合之间的亲疏程度;

②根据变量分类的结果,可以选择最佳的变量组合进行回归分析或者Q型聚类分析。选择最佳变量,即在聚合的每类变量中选出一个具有代表性的变量作为典型变量。;R型聚类的统计量对变量进行聚分类析时,通常采用相似系数来表示变量之间的亲疏程度。

常用的相似系数有:

(1)夹角余弦

(2)相关系数

(3)指数相似系数

(4)非参数方法;SAS解决方案;CLUSTER语句格式;在CLUSTER语句的“METHOD=”关键字下,可以指定11种系统聚类方法。

AVERAGE:类平均法

CENTROID:重心法

COMPLETE:最长距离法

DENSITY:密度估计法

EML:最大似然谱系聚类

FLEXIBLE:可变类平均法

MCQUITTY:可变法及McQuitty相似分析法

MEDIAN:中间距离法

SINGLE:最短距离法

TWOSTAGE:两阶段密度估计法

WARD:离差平方和法

;FASTCLUS语句格式;例题1;树形图;例题2;;VARCLUS语句格式;TREE语句格式;例:100个学生的数学、物理、化学、语文、历史、英语的成绩如下表(部分)。

;;;THANKYOU!

文档评论(0)

实验室仪器管理 + 关注
实名认证
服务提供商

本人在医药行业摸爬滚打10年,做过实验室QC,仪器公司售后技术支持工程师,擅长解答实验室仪器问题,现为一家制药企业仪器管理。

1亿VIP精品文档

相关文档