网站大量收购闲置独家精品文档,联系QQ:2885784924

第六章_聚类分析.ppt

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章_聚类分析

1.最短距离法 (1) 最短距离 如图,定义p类和q类间的最短距离为: (6-8) dij是p、q类中任意2个样品Xi与Xj之间的距离。用最短距离进行的聚合聚类叫做最短距离法。 最短距离 最长距离 图6-2 类间距离 A B C D p类 q类 聚类过程中不可避免要涉及到合并成的类与另一个类之间最短距离的计算。 图6-3 类r与类f的最短距离 如果p类和q类合并为类r,计算类r与另外的类f之间最短距离时,直接方法是逐一计算类r与类f中所有个体间的距离,选最小者即为最短距离。 (6-9) p类 q类 f类 r类 为计算便捷,可由之前的计算结果进行递推,递推公式为: 油源对比包括原油与原油、原油与生油岩的对比,主要是解决油源的问题。设编号为①、②、③的样品是取自生油层k1、k2、k3的岩样,编号为④的样品是取自储层k0的油样。需解决的问题是:k0的油来自哪个生油层?表6-2给出了油源对比常用的甾烷族化合物相对含量。 表6-2 甾烷族化合物相对含量 12.80 7.81 15.90 7.81 13.10 10.78 储集层油样(k0) 10.70 9.40 13.20 9.61 10.20 9.65 生油层岩样(k3) 7.80 7.12 8.10 5.30 6.12 5.30 生油层岩样(k2) 9.11 5.20 15.80 5.78 11.20 3.72 生油层岩样(k1) 414 412 400 398 386 372 分子离子 样品 以油源对比为例,说明聚类过程 计算个体(样品)点间的距离矩阵,记为: ① ② ③ ④ 第一级聚类 D(0)中,d34=d43= 5.2110 在所有距离中最短。 准备工作 表明岩样k3与油样k0的甾烷族化合物相对含量最接近,应合成1类,记为r, r={③,④}。同时按式(6-9)计算类r与其它各类间的最短距离矩阵,记为D (1) : 第二级聚类 ① ② r ={③,④} 在D(1)中,d13=d31=8.8183在所有距离中最短,表明①与r类最亲近,应合为1类,记为k, k={③,④,①}。再按式(6-9)计算类k与其它各类(仅剩下编号为②的样品了)间的最短距离矩阵,记为D(2) : 由D(2)可知,四个样品以距离D = 9.6553聚为一大类。按聚类顺序绘制聚类谱系如下: 0.0000 5.2110 8.8183 9.6553 ① ③ ② ④ 根据聚类谱系图,可认为k0储层中的油主要来自k3生油层,但也不能排除混有其他生油层的油。 第三级聚类 (2) 最短距离法聚类的基本过程 ①准备工作 计算个体(样品或变量)点间的距离矩阵: ②第一级聚类 在D(0)中找出距离最短的类合成1类,记为r。按式(6-9)计算类r与其它各类间的最短距离矩阵D(1); ③第二级聚类 在D(1)中找出距离最短的类合为1类,记为k。按式(6-9)计算类k与其它各类间的最短距离矩阵D(2); ④重复上述过程, 直到全部样品聚为一类为止。 2. 最长距离法 (1) 最长距离 定义p与q间的最长距离: (6-10) 式中dij为p、q类中2个样品Xi与Xj之间的距离。 用最长距离进行的聚合聚类称最长距离法。若p类与q类聚为类r,新类r与另外的类f之间的最长距离可由下列递推公式算出。 定义p类、q类间的平均距离为两类中所有个体间距离的平均值: (2) 聚类过程 聚类过程与最短距离法聚类相同,不同处是按式(6-10)计算下一级聚类的矩阵(计算最长距离)。 3. 类平均法 (1) 类平均距离 式中np 、nq是类p、q中个体数。dij为类p、q中2个个体Xi与Xj之间的距离。 假设类p、q 的重心分别是 、 ,那么类 p、q 间的重心距离为: 用类平均距离进行的聚合聚类叫做类平均法。若类p、类q合并为类r,计算新类r与另外的类f之间类平均距离的递推公式为: (2) 类平均法聚类过程 与上述方法相同,不同处是计算类平均距离。 4. 重心法 类p、q合成类r后,类r的重心为:

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档