- 1、本文档共55页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
58聚类分析资料.ppt
5.8 聚类分析 一、聚类分析的经济背景 二、聚类分析的数学解释 三、聚类分析在农业经济中的应用 一、聚类分析的经济背景 (一)单指标分类:单指标排序 (二)多指标分类:各地区居民生活水平指标: 经济生活质量指数 教育生活质量指数 健康生活质量指数 居住生活质量指数 按已知数据对30个省进行分类研究。 二、聚类分析的数学解释 (一)聚类分析 当确定了样品或变量间的距离或相似系数后,就要对样品或变量进行分类。 1、层次聚类:一类是在样品距离的基础上定义类与类之间的距离,即首先将n个样品自成一类,然后每次将具有最小距离的两类合并,合并后重新计算类与类之间的距离这个过程直到所有的样品归为一类为止,将这一过程作成图,称为聚类谱系图(Hierarchical Diagram); 2、迭代聚类(快速聚类):将n个样品初步分类,然后根据分类函数尽可能小的原则,对已分类别进行调整,直到分类合理为止,这一过程称为调优法。 (二)层次聚类分析 层次聚类分析(系统聚类)(Hierarchical Cluster)是聚类分析中应用最广泛的一种,凡是具有数值特征的变量和样本都可以采用层次聚类分析,选择不同的距离和聚类方法可以获得满意的数值分类效果。 1、层次聚类分析的步骤: (1)聚类前首先对数据进行变换处理(选择相关性小且贡献大的指标,转化成无量纲的数据); (2)聚类分析时先分成n 类,计算样品之间的距离,并将距离最近的两个样品并成一类; (3)选择并计算类与类之间的距离,并将距离最近的两类合并,如果类的个数大于1,则继续,直到所有的样品并为一类为止; (4)最后绘制层次聚类谱系图(树状图)。 5、聚类方法 常用的聚类方法有如下7种: (1)最短距离法(最近邻元素)(Nearest Neighbor): 两类的距离定义为一类的所有个体与另一类的所有个体之间的距离最小者。 (2)最长距离法(最远邻元素)(Further Neighbor): 两类的距离定义为一类的所有个体与另一类的所有个体之间的距离最大者。 (3)中间距离法(中位数聚类法)Median clustering): 两类的距离定义采用界于最短距离和最长距离之间的中间距离(取三角形的中线)。 三、聚类分析在农经研究中的应用 例1:商厦分类 三、聚类分析在农经研究中的应用 例2 各地区居民生活水平指标: 经济生活质量指数 教育生活质量指数 健康生活质量指数 居住生活质量指数 按已知数据对30个省进行分类研究。 构建初始分类中心文件 最短距离法 最长距离法 重心法 组间连接法 离差平方和法 (二)迭代聚类分析 1、打开SPSS软件 2、输入数据(e5-8-1) 3、在SPSS中选定:Analyze--?classify--?k--means cluster… * * (三)聚类分析的功能: 建立一种分类方法,将一批样品或变量按照它们在性质上的亲疏程度进行分类。 (四)描述亲疏程度的途径: 1、对样品进行分类:把每个样品看成是m维(变量的个数)空间的一个点,在m维坐标系中,定义点与点之间的某种距离,距离越近,其亲密程度越好; 2、对变量进行分类:定义某种相似系数,性质越接近的变量,他们之间的相似系数越接近于1(-1),彼此无关的变量,它们之间的相似系数越接近于0。 2、数据变换处理(标准化处理): (1)极差正规化(极差从0到1):从变量的数据中找出最大和最小值,其差称为极差。每一个原始数据减去变量的最小值,再除以极差,则得到极差正规化数据(最大数为1,最小数为0); (2)标准化变换(标准差为1):先标准化,再除以标准差(均值为0,方差为1); 3、距离: (1)dij=0 (2)dii=0 (3)dij=dji (4)dij=dik+dkj 4、相似系数 在对变量进行分类时,通常采用相似系数来表示变量之间的亲疏程度。 相似系数定义如下: (4)重心法(质心聚类法)(Centroid clustering): 将两类的距离定义为两类重
文档评论(0)