- 1、本文档共52页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一. 样本点之间的相似性测度 ——距离 ei∈R p ei与ek的相似程度: d2(ei,ek) 定义:距离 d(· ,·):? ? ? ? R+ ① d(x,y)≥0 ?x,y? ? (正定性) d(x,y) = 0 当且仅当 x=y ② d(x,y) = d(y,x) (对称性) ③ d(x,y) ? d(x,z) + d(z,y) (三角不等式) 二. 类与类之间的相似性测度——聚合指数 问题:如果有两类G1,G2,怎么测量它们之间距离? — “聚合指数” 系统聚类是逐步过程: 1. 最短距离法: I II III 一类 二类 Dmin Dmax 2. 最长距离法: 3. 重心法: 4. 类平均法: 等于G1和G2中所有样本点间距离的平均。 Dg 5. 离差平方和法: 定义: D(G1,G2)=D1+2-D1-D2 事实上:若G1和G2均能自身充分聚合,并且G1和G2又充分分离,则有D1+2-D1-D2很大。 D1 D1+2 D2 组间变差 三. 定量变量聚类分析 例:推销员问题 首先明确: ?用什么方法测度距离d2(wi,wk) ? ②用什么方法测度聚合指数D(G1,G2)? 最短距离法: I. 构造距离矩阵: Ⅱ. w1……w5自成一类: h1……h5 选择最接近的两元素聚成一类: III. 计算新类之间的关系:w3, w4,w5 , h6 D(w3,h6)=min{d(w3,w1),d(w3,w2)} =min{4,3}=3 D(w4,h6)=min{d(w4,w1),d(w4,w2)} =min{6,5}=5 D(w5,h6)=min{6,5}= 5 取最相似的并成一类: IV. 计算新类之间的关系:w5 h6 h7 取最相似并为一类:h8=h6?h7 平台高度: f(h8)=3 V. 计算新类关系:w5 ,h8 D(w5,h8)=min{D(w5,h6),D(w5,h7)}=min{4,5}=4 h9=w5∪h8 f(h9)=4 由于所有点已聚为一类,计算停止,转入绘聚类图. VI. 绘制聚类图:二分树法 分成二类:(w1 w2 w3 w4)(w5) 分成三类:(w1,w2),(w3,w4),(w5) 全体的类集合:{h1……h5 ,h6,h7,h8,h9} h6 h7 h8 h9 f (h) 1 2 4 3 h9 ╱ ╲ h8 w5 ╱ ╲ h6 h7 ╱ ╲ ╱ ╲ w1 w2 w3 w4 (二)聚合指数:最大距离法 ? 测度距离 d2(wi,wk) ② 测度聚合指数 D(G1,G2) 最大距离法: I. 构造距离矩阵: II. w1……w5自成一类; 选择最接近的两元素聚成一类: III. 计算新类之间的关系:w3 w4 w5 h6 D(w3,h6)=max{d(w3,w1),d(w3,w2)} =max{4,3}= 4 D(w4,h6)=max{d(w4,w1),d(w4,w2)} =max{6,5}= 6 D(w5,h6)=max{6,5}= 6 取最相似的并成一类: IV. 计算新类之间的关系:w5 h6 h7 取最相似并为一类:h8=w5 ?h7 平台高度: f(h8)=4 V. 计算新类关系:h6 ,h8 D(h6,h8)=max{D(h6 ,w5),D(h6,h7)}=max{6,6}=6 h9=h6∪h8 f(h9)=6 由于所有点已聚为一类,计算停止,转入绘聚类图. VI. 绘制聚类图:二分树法 分成二类:(w1,w2 ),(w3,w4,w5) 分成三类:(w1,w2),(w3,w4),(w5) 全体的类集合:{h1……h5 ,h6,h7,h8,h9} h6 h7 h8 h9 f (h) 1 2 6 4 h9 ╱ ╲ h6 h8 ╱╲ ╱╲ w1 w2 w5 h7 ╱╲ w3 w4 怎样判断 应分为几类更合适 谱系图:标度突变法 SPSS软件应用(drink. sav) 1、系统聚类法
您可能关注的文档
- ch4-第四章划分与调度讲述.ppt
- CH5-2-疲劳强度直接计算法-2014-03-26讲述.ppt
- ch5.1磁电式传感器讲述.ppt
- ch2-Cortex-M3+体系结构讲述.ppt
- CH5精品课程录像讲述.ppt
- ch6-第六章CacheCoherence讲述.ppt
- ch23活断层地震110214讲述.ppt
- ch7数据库的安全与控制讲述.ppt
- ch5空中信道讲述.doc
- ch8应用层:域名系统DNS讲述.ppt
- 考点解析-北师大版9年级数学上册期中试题附参考答案详解【综合题】.docx
- 解析卷-北师大版9年级数学上册期中试题及完整答案详解【有一套】.docx
- 难点详解北师大版9年级数学上册期末试卷附答案详解(实用).docx
- 解析卷北师大版9年级数学上册期中测试卷附答案详解【基础题】.docx
- 考点攻克北师大版9年级数学上册期中试卷【突破训练】附答案详解.docx
- 解析卷北师大版9年级数学上册期中测试卷含答案详解【综合题】.docx
- 综合解析北师大版9年级数学上册期中试卷及参考答案详解【A卷】.docx
- 强化训练-北师大版9年级数学上册期中试卷附完整答案详解(有一套).docx
- 解析卷-北师大版9年级数学上册期中试卷【精练】附答案详解.docx
- 综合解析北师大版9年级数学上册期中试题附完整答案详解【精选题】.docx
文档评论(0)