第07讲计算机地质学---聚类分析与地质应用(46页)概要.ppt

第07讲计算机地质学---聚类分析与地质应用(46页)概要.ppt

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第07讲计算机地质学---聚类分析与地质应用(46页)概要

(2)样品的选择 样品的选择对聚类结果也有重大的影响,选择样本时特别应该注意样品的代表性,注意随机抽样和足够的样本容量。 7.4.4 聚类分析结果的利用(地质解释) (1)聚类分析结果的优化 在原始数据不变的情况下,可以通过改变数据预处理方法和改变相似性统计量(聚类统计量),并结合定性分析结果,发挥计算机快速计算的优点,安排多次反复试算,最终找到最优的符合实际情况的聚类分析方法。 7 聚类分析与地质应用 西安科技大学 薛喜成 计算机地质学 主要内容 7.1 聚类分析概述 7.2 聚类分析解题原理 7.3 聚类分析计算步骤 7.4 聚类分析问题讨论 7.5 聚类分析地质应用 7.1 聚类分析概述 7.1.1 科学分类的重要性 实现科学分类是众多科学的基础研究领域之一,没有科学的分类就无法深入的研究问题,在地质科学与地质工程研究领域,各个学科分支的分类问题都非常普遍,例如古生物分类、岩石性质分类、地层对比等。 7.1.2 定性分类的缺陷 根据人的经验和总结对研究对象进行分类,最终分类的主观性较强,人为影响大,分类没有科学性依据。 7.1.3 数字分类 随着数学的发展,人们开始考虑使用研究对象的许多定量指标进行定量分类的探索,这种分类方案具有严密的数学处理理论和方法,客观性强,减少了人为主观性的影响,本章要讲聚类分析就是一种很好的数字分类方案。聚类分析最早用于生物分类,后来被引用到地质领域。聚类分析在各门学科中应用较广,凡是有关分类的问题,都可用聚类分析进行划分。 7.1.4 聚类分析的基本思想 聚类分析又称为点群分析、丛分析、簇分析。聚类分析将研究对象看作一个空间点群,然后用数学方法研究点与点之间的疏密关系(相似性),将事物个体之间关系密切的逐渐聚合成一类,以达到对研究对象分类或者对比的目的。 7.1.5 聚类分析的分类 (1)按照分类对象不同,聚类分析可以分为以下两种类型: ① Q型聚类分析 主要用来对样品进行定量分类。 ② R型聚类分析 主要用来对地质变量进行分类,侧重于研究地质变量之间的相互关系。 (2)按照数学原理不同,可以将聚类分析分为系统聚类、动态聚类、图论聚类、模糊聚类和灰色聚类。 (3)按照聚类方法不同,可以将聚类分析分为以下两种: ① 划分法 将研究对象由大到小逐步进行归类。1类—2类—…—n类。 ②聚合法 将研究对象由小到大进行归类。n类—n-1类—…—2类—1类。 本章主要介绍系统聚类分析中的Q型聚类分析和R型聚类分析,且以聚合法为主,并配套有相应的程序软件。 7.2 聚类分析解题原理 7.2.1 衡量样品之间的相似性 (1)构造相似性统计量(聚类统计量),用来表达样品之间的关系密切程度,可用的聚类统计量较多,如:欧氏距离系数、斜交距离系数和夹角余弦等。 (2)欧氏距离:欧氏距离越小,样品之间的关系越密切,一般希望,相似性统计量越大,样品之间的关系越密切,因此,要将欧氏距离转变为欧氏距离系数。 (3)欧氏距离系数 从欧氏距离的计算公式中不难发现,欧氏距离受到原始数据量纲和地质变量个数(维数)的明显影响。为了消除这种影响,在进行聚类分析之前,必须对原始数据元素进行相应的预处理,以统一量纲。为了消除维数的影响,采用欧式距离系数作为聚类统计量。这样,欧式距离系数越大,则样品之间的关系越密切。 7.2.2 样品归类 (1)一次计算聚类法(一次计算成群法) 利用原始数据计算一次相似性统计量矩阵,然后按照相似性统计量的大小,将样品逐步进行归类。一次计算聚类法计算量小,方法简单易行,当样品之间的分类关系比较简单时,往往可以快速地收到较好地分类效果。 (2)逐步计算聚类法(逐步计算成群法) 利用原始数据计算一次相似性统计量矩阵,首先选择相似性统计量最大的样品进行归类,然后计算这一类的“重心值”,将两行数据求平均合成一行,构成新的数据矩阵,重新计算新的相似性统计量矩阵……。 (3)迭次推算聚类法(迭次推算成群法) 迭次推算聚类法是逐步计算聚类法的进一步发展,它仍是从原始相似性统计量矩阵出发,挑选最相似的样品进行联结合并。但它不需要修正原始数据,而是在类结构形成的过程中,利用前一步相似性统计量

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档