- 1、本文档共44页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元统计应用第四讲[聚类分析]
《数理统计及其应用》;第一节 聚类分析方法
第二节 聚类统计量
第三节 无量纲化方法
第四节 Q型系统聚类法
第五节 R型系统聚类法
第六节 快速聚类法
推荐阅读
;第一节 聚类分析方法;基本程序:是根据一批样品的多个观测指标,具体地找出一些能够度量样品或指标之间相似程度的统计量,然后利用统计量将样品或指标进行归类。
具体进行聚类时,由于目的、要求不同,因而产生各种不同的聚类方法:
由小类合并到大类的方法
由大类分解为小类的方法
静态聚类法、动态聚类法
按样本聚类(Q)、按指标聚类(R)
;在社会经济领域中存在着大量分类问题,如:
对我国31个省市自治区独立核算工业企业经济效益进行分析,一般不是逐省市自治区去分析,而较好地做法是选取能反映企业经济效益的代表性指标,如百元固定资产实现利税、资金利税、产值利税率等,根据这些指标对全国各省市自治区进行分类,然后根据分类结果对企业经济效益进行综合评价,就易于得出科学的分析。
;第二节 聚类统计量;概述;Q型聚类统计量(距离);3、明考斯基距离(Minkowski)
4、兰氏距离
5、马氏距离
6、切比雪夫距离(Chebychev)
;R型聚类统计量;1、夹角余弦
2、相关系数
3、同号率
;第三节 无量纲化方法;1、极差正规化(规格化变换、阈值法)
2、标准化变换
3、功效系数法
4、相对化变换;例:某年我国部分省市经济效益情况
用以上几种方法对其无量纲化。;第四节 Q型系统聚类法;步骤:;类与类间距离的确定;最短距离法(Nearest Neighbor);G1={辽宁},G2={浙江},G3={河南},G4={甘肃},G5={青海}
=[(7.9-7.68)2+(39.77-50.37)2+(8.49-11.35)2+(12.94-13.3)2+
(19.27-19.25)2+(11.05-14.59)2+(2.04-2.75)2+(13.29-14.87)2]0.5=11.67
d13=13.80 d14=13.12 d15=12.80 d23=24.63 d24=24.06 d25=23.54
d34=2.2 d35=3.51 d45=2.21
1 2 3 4 5
D1=1 0
2 11.67 0
3 13.80 24.63 0
4 13.12 24.06 2.20 0
5 12.80 23.54 3.51 2.21 0; d61=d(3,4)1=min{d13,d14}=13.12 d62=d(3,4)2=min{d23,d24}=24.06
d65=d(3,4)5=min{d35,d45}=2.21
6 1 2 5
6 0
D2= 1 13.12 0
2 24.06 11.67 0
5 2.21 12.80 23.54 0
d71=d(3,4,5)1=min{d13,d14,d15}=12.80;d72=d(3,4,5)2=min{d23,d24,d25}=23.54
7 1 2
D3=7 0
1 12.80 0
2 23.54 11.67 0;d78=min{d71,d72}=12.80
7 8
D4= 7 0
8 12.8 0
河南3
甘肃4
青海5
辽宁1
浙江2
;最长距离法(furthest neighbor);d13=13.80 d14=13.12 d15=12.80 d23=24.63 d24=24.06
d25=23.54 d34=2.2 d35=3.51 d45=2.21
1 2 3 4 5
D1= 1 0
2 11
文档评论(0)