网站大量收购独家精品文档,联系QQ:2885784924

[数学]第四章聚类分析.ppt

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[数学]第四章聚类分析

第四章 聚类分析 海洋与气象学院大气科学专业 教学要求 掌握聚类分析的基本概念 掌握系统聚类分析的统计量 了解系统的聚类方法 是研究多个要素的客观分类方法。是多元统计分析中研究事物客观分类的一种数学方法,它以研究对象间的相似程度为分类依据,把相似程度较高者归为一类,使不同类之间有显著的差异。 聚类分析 新近发展起来的一门多元统计分类法,它可避免传统分类法的主观性和任意性的缺点 事先无需知道分类对象的分类结构,而只需要一批数据;然后选好分类统计量,并按一定的方法步骤进行计算;最后便能自然地、客观地得出一张完整的分类系统图 根据研究对象(或指标)的属性或特征的相似性、亲疏程度,用数学的方法把它们逐步地分型划类,最后得到一个能反映个体或站点之间、群体之间亲疏关系(相似程度)的分类系统。根据各类之间的亲疏关系,逐步画成一张完整的分类系统图,又称为聚类树图或聚类分枝图。 基本思路 判别分析与聚类分析的区别 判别分析是已知研究对象的若干类型,用已取得各种类型的一批已知样品的观测数据,根据某些准则建立判别式,然后对未知类型的样品进行判别分类 聚类分析则是对一批事先并不知道类型的样品进行分类划分。 常用于大气环流形势的分类,天气过程的分类,气候、农业气候区划等。 聚类分析在大气科学中的应用 第一节 相似性度量(统计量)指标 第二节 逐级归并法 第三节 K-均值法 第四章 聚类分析 第一节 相似性度量(统计量)指标 两个大气状态的相似是三维空间中的多个物理量之间的相似,要用一个指标表征这样两物理图象之间的相似是困难的。 把研究的个体看成多维空间中的一个点,用一般计算方法计算点间距离,以作相似性度量。 度量指标 相似距离 假若研究不同空间点的相似性时 ·P2 ·Pp ·P1 X4 Xk X2 X1 X3 ·P3 若空间点P是由K个因子决定的;则可看成是“K维空间中的P点”,即P(x1,x2,,,,,xk) 湛江与广州的气候相似性: 由年平均气温,年总降水量,年日照时数,年太阳辐射等等各种气象要素构成的 …… 假若研究不同空间点的相似性时 ·P2 ·Pp ·P1 X4 Xk X2 X1 X3 ·P3 若空间点P是由n个样本时间点决定的,则可将P空间点看成“n维空间中的P点” 若空间点P是由K个因子决定的;则可看成是“K维空间中的P点”,即P(x1,x2,,,,,xk) ·P2 ·Pp ·P1 n4 nk n2 n1 n3 ·P3 若空间点P是由K个因子决定的;则P可看成是“K维空间中的P点”,即P(x1,x2,,,,,xk) 若空间点P是由n个样本时间点决定的,则可将P空间点看成“n维空间中的P点” 假若研究不同空间点的相似性时 假若研究不同时间点的相似时 若时间点n是由P个因子决定的,则n可看成是“P维空间中的n点”,即 n(x1,x2,,,,,xp)维空间中的n个点。 ·n2 ·np ·n1 x4 xp x2 x1 x3 ·n3 一、距离系数 1.距离系数的统计量公式(见P182) 对于不同的时间点间的相似性 当计算第i点与第j点时间点的距离有 欧氏距离 i,j=1,2,3,,,,n p:因子数 平均距离 域块距离 若对空间点之间距离的度量,可将上式中的i、j改为k、l即可 如欧氏距离 对称性:两点间的距离是相同的。d(P,Q)=d(Q,P) 非负性:d(P,Q)≥0 单一性d(P,P)=0 唯一性:若P=Q,则有d(P,Q) ≥0 距离三角不等式:d(P,Q)≤d(P,R)+d(R,Q) 2.距离系数的性质 i:是因子数或是样本数 二、相似系数 常用于衡量要素场中不同时间点之间的相似程度。 j(xj1 , xj2) i(xi1 , xi2) X2 X1 若把x1作为横坐标,x2作为纵坐标 当有i、j两个个例时 则在直角坐标图中可表示为: i(xi1 , xi2) j(xj1 , xj2) · · θ i、j两向量的夹角用θ表示 两个向量之间的夹角余弦度 j(xj1 , xj2) i(xi1 , xi2) X2 X1 · · θ 讨论 若两向量完全相同: θ=0,cosθij=1 若两向量正交: θ=90, cosθij=0 不相似 完全相似 若两向量完全相反: θ=180,cosθij= -1 完全不相似 若时间点是由P个相似因子决定的,则把i、j两个看成为P维空中的两个向量,则i、j之间的夹角余弦为 取值范围[-1,1] 相似系数: 取反函数 单位:弧度,取值范围:0~π 三、相关距离系数 衡量要素场中不同空间点之间的相似统计量 每个空间点是由n个样本决定的。 第k与第l空间点的相关系数 距平变量的Sij 取反函数

文档评论(0)

jiupshaieuk12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6212135231000003

1亿VIP精品文档

相关文档