- 1、本文档共50页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
34 系统聚类法
* * §3.4 系统聚类法 目录 上页 下页 返回 结束 3.4.1 最短距离法和最长距离法 所谓最短距离法就是类与类之间的距离采用(3.12)的系统聚类方法。 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 所谓最长距离法是类与类之间的距离采用(3.13)的系统聚类法。选择最大的距离作为新类与其他类之间的距离,然后将类间距离最小的两类进行合并,一直合并到只有一类为止。 上述两方法中,主要的不同是计算新类与其他类的距离的递推公式不同。 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 最短距离法也可用于对指标的分类,分类时可以用距离也可以用相似系数。但用相似系数时应找最大的元素并类,计算新类与其他类的距离应使用公式(3.19)。 最短距离法的主要缺点是它有链接聚合的趋势,因为类与类之间的距离为所有距离中的最短者,两类合并以后,它与其他类的距离缩小了,这样容易形成一个比较大的类,大部分样品都被聚在一类中,在树状聚类图中,会看到一个延伸的链状结构,所以最短距离法的聚类效果并不好,实际中不提倡使用。 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 最长距离法克服了最短距离法链接聚合的缺陷,两类合并以后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离。 本例中最短距离法与最长距离法得到的结果是相同的。 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 3.4.2 重心法和类平均法 从物理的观点看,一个类用它的重心(该类样品的均值)做代表比较合理,类与类之间的距离就用重心之间的距离来代表。 重心法虽有很好的代表性,但并未充分利用各样本的信息 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 类平均法是聚类效果较好、应用比较广泛的一种聚类方法。它有两种形式,一种是组间联结法(Between-groups linkage),另一种是组内联结法(Within-groups linkage)。组间联结法在计算距离时只考虑两类之间样品之间距离的平均,组内联结法在计算距离时把两组所有个案之间的距离都考虑在内。 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 3.4.3 离差平方和法(或称Ward方法) 离差平方和方法是由Ward提出来的,许多资料上称做Ward法。他的思想是来于方差分析,如果类分得正确,同类样品的离差平方和应当较小,类与类之间的离差平方和应当较大。 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 离差平方和法放弃了在一切分类中求的极小值的要求,而是设计出某种规格:找到一个局部最优解,Ward法就是找局部最优解的一个方法。 其思想是先将n个样品各自成一类,然后每次缩小一类,每缩小一类离差平方和就要增大,选择使增加最小的两类合并,直到所有的样品归为一类为止。 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 由于上述的聚类方法得到的结果是不完全相同的。于是产生一个问题:我们应当选择哪一个结果为好?为了解决这个问题,需要研究系统聚类法的性质,现简要介绍如下。 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 * * § 3.6 K-均值聚类和有序样品的聚类 目录 上页 下页 返回 结束 3.6.1 K-均值法(快速聚类法) 非谱系聚类法是把样品(而不是变量)聚集成K个类的集合。类的个数K可以预先给定,或者在聚类过程中确定。非谱系方法可应用于比系统聚类法大得多的数据组。 非谱系聚类法或者一开始就对元素分组,或者从一个构成各类核心的“种子”集合开始。选择好的初始构形,将能免除系统的偏差。一种方法是从所有项目中随机地选择“种子”点或者随机地把元素分成若干个初始类。 * * § 3.6 K-均值聚类和有序样品的聚类 目录 上页 下页 返回 结束 K-均值法, 又叫快速聚类法,是Macqueen于1967年提出的,其思想是把每
您可能关注的文档
- 2014年老龄办上半年重点工作完成情况及下一步工作.doc
- 2014年高考数学理科分类汇编专题09圆锥曲线.doc
- 2014新目标英语八年级下册词汇专练(精编资料 ).doc
- 2015三项合同履行情况汇报.doc
- 201503教学查房心脏病病人非心脏手术麻醉术前评估.docx
- 2015专业技术人员权益保护试题与答案.doc
- 2015年二级建造师之法规重点解析.doc
- 2015年呼和浩特市中考一模语文试题(答案)(精编资.doc
- 2015高考政治时政热点专题复习四“互联网 ”.doc
- 2016上科教版七年级下信息技术教案第2单元美食天.doc
- 温州乐成寄宿中学2023年高三第二次模拟考试语文试卷含解析.doc
- 湖南省浏阳市第二中学2022-2023学年高三第一次调研测试语文试卷含解析.doc
- 甘肃省张掖市高台县重点名校2024年中考一模英语试题含答案.doc
- 甘肃省会宁县第四中学2024届高三下学期第六次检测语文试卷含解析.doc
- 滁州市重点中学2024届高三第四次模拟考试语文试卷含解析.doc
- 福建省福州市仓山区福建师范大学附属中学2023届高考冲刺模拟英语试题含解析.doc
- 福建省平和县一中2022-2023学年高考压轴卷语文试卷含解析.doc
- 湖南省长沙市一中、湖南师大附中2023年高三英语第一学期期末学业质量监测模拟试题含解析.doc
- 监狱警察职业道德培训课件.pptx
- 福建省漳州市平和一中、南靖一中等五校2023年高三第六次模拟考试语文试卷含解析.doc
最近下载
- 税务局精神文明建设创建工作总结.docx VIP
- 学校精神文明建设工作总结范文.docx VIP
- (高清版)D-Z-T 0454.2-2023 钛铁矿化学分析方法第2部分:二氧化钛含量的测定过氧化氢光度法.pdf VIP
- 血透护理优质服务.pptx VIP
- 食堂管理年终工作总结PPT.pptx
- 巨量千川营销师(初级)认证考试复习题库资料(含答案).pdf
- (高清版)D-Z-T 0454.3-2023 钛铁矿化学分析方法第3部分:铝、钙、镁、钾、钠、钛、锰、铬、锶、钒和锌含量的测定混合酸分解-电感耦合等离子体原子发射光谱法.pdf VIP
- 安全措施和应急预案.pdf VIP
- 8职业生涯规划书教材.pdf
- 2.4蛋白质是生命活动的主要承担者(第2课时)课件-高一上学期生物人教版(2019)必修1.pptx
文档评论(0)