当代GIS理论与方法Chap5 PGIS2014.ppt

  1. 1、本文档共471页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
当代GIS理论与方法Chap5 PGIS2014

应用实例 区域经济发展空间自相关分析 ArcGIS空间统计工具箱包含一系列用于分析空间分布、模式、过程和关系的统计工具。与传统的非空间统计分析方法不同,空间统计方法是将地理空间(邻域、区域、连通性和/或其他空间关系)直接融入到数学逻辑中。 地理学第一定律: 地理现象在空间分布上相互关联,越近的现象关联越紧密。--空间相似性 地理学第二定律: 地理现象(过程)在空间分布上的不均匀性及其复杂性。--空间异质性 空间统计与经典统计的共同点: 它们都是在大量采样的基础上,通过对样本属性值的频率分布、均值、方差等关系及其相应规则的分析,确定其空间分布格局与相关关系。 空间统计与经典统计的显著区别: 空间统计既考虑样本值的大小,又重视样本空间位置及样本间的距离。空间数据具有空间依赖性(空间自相关) 和空间非均质性(空间结构),扭曲了经典统计的假设条件,使得经典统计模型对空间数据的分析会产生虚假的解释。经典统计模型是在观测值相互独立的假设基础上建立的,但地理现象之间大都不具有独立性。空间统计研究的基础是空间对象间的相关性和非独立的观测,它们与距离有关,并随着距离的增加而变化。--需要变异函数 传统统计分析在同一空间位置处可以多次采样数据。空间统计分析中,样本区域中每一个空间位置多为一次采样数据。根据传统统计学,一次采样数据中无法推断出总体规律。 --需要平稳性假设 经典统计:独立性、随机性假设 空间统计:自相关、依赖性、异质性 空间统计分析基础 基本统计量 数据的频数分析 频数: 将变量xi(i=1,2,…,n)按大小顺序排列,并按一定的间距分组。变量在各组出现或发生的次数称为频数。 频率:各组频数与总频数之比叫做频率。 频率直方图:若以纵轴表示频率,横轴表示分组,就可做出频率直方图,用以表示事件发生的概率和分布状况。 数据的集中趋势分析 数据的集中趋势分析是用来反映数据的一般水平,常用的指标有平均值、中位数和众数等。 如果各个数据之间的差异程度较小,用平均值就有较好的代表性; 如果数据之间的差异程度较大,特别是有个别极端值的情况,用中位数或众数有较好的代表性。 数据的离散程度分析 数据的离散程度分析主要是用来反映数据之间的差异程度, 常用的指标有:方差和标准差。 方差是标准差的平方,根据不同的数据类型有不同的计算方法。 是以离差平方和除以变量个数求得的。 反映数据的离散程度的指标还包括: 极差、离差、平均离差、离差平方和、变差系数等。 极差:是一组数据中最大值与最小值之差。 离差:一组数据集中的各数据值与其平均数之差称为离差。 一个数据集的离差和恒等于0。 数据的分布 在统计分析中,通常要假设样本的分布属于正态分布,因此需要用偏度和峰度两个指标来检查样本是否符合正态分布。 偏度:衡量的是样本分布的偏斜方向和程度; 峰度:衡量的是样本分布曲线的尖峰程度。 正态 QQ 图和普通 QQ 图 分位数-分位数 (QQ) 图是两种分布的分位数相对于彼此进行绘制的图。 如何构建正态 QQ 图 首先,数据经过排序,且第 i 个值的累积分布值按照公式 (i– 0.5)/n?进行计算(累积分布值给出了某个特定值以下的值所占的数据比例)。累积分布图通过以比较方式绘制有序数据和累积分布值得到。 生成这两个累积分布图后,对与指定分位数相对应的数据值进行配对并绘制在 QQ 图中。 普通 QQ 图 使用 QQ 图检查数据分布 正态 QQ 图上的点可指示数据集的单变量分布的正态性。如果数据是正态分布的,点将落在 45 度参考线上。如果数据不是正态分布的,点将会偏离参考线。 在下图中,标准正态分布的分位数值绘制在正态 QQ 图中的 x 轴上,数据集的相应分位数值绘制在 y 轴上。可以看到点落在 45 度参考线附近。与此线的主要偏离发生在高臭氧浓度值处。 正态 QQ 图工具可用于选择未落在参考线附近的点。所选的点的位置将高亮显示在 ArcMap 数据视图中。 什么是 z 得分?什么是 p 值? 大多数统计检验在开始时都首先确定一个零假设(指进行统计检验时预先建立的假设)。模式分析工具的零假设是完全空间随机性 ,工具所返回的 z 得分和 p 值有助于判断是否可以拒绝零假设。当运行某一工具并希望通过 z 得分和 p 值拒绝零假设,即:要素(或与要素关联的值)表现出统计意义上的显著性聚类或离散模式,而不是随机模式。 p 值表示概率。对于模式分析工具来说,p 值表示所观测到的空间模式是由某一随机过程创建而成的概率。当 p 很小时,意味着所观测到的空间模式不太可能产生于随机过程(小概率事件),因此可以拒绝零假设。 Z 得分表示标准差的倍数。例如,如果工具返回的 z 得分为 +2.5,我们就会说,结果是 2.5 倍标准差。 在正态分布的两端

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档