第二章环境数据统计与分析.ppt

  1. 1、本文档共81页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 环境数据 统计与分析 2 环境数据统计与分析 2.1 数据统计与分析的基本范畴 2.2 常用的统计指标 2.3 环境样本特征推断 2.4 参数估计 2.5 显著性检验 2.6 直线相关与直线回归 2.7 环境数据统计与分析的计算机处理 2.8 可疑值的取舍 2.1 数据统计与分析的基本范畴 2.1.1 总体与样本 统计学中,把性质相同的研究对象的所有观测结果的集合称为总体(population)。总体又分为无限总体和有限总体。 在实际工作中,常常是从被研究的总体中随机抽取部分观测结果进行研究。每个部分观测结果的集合称为样本。 从总体中随机抽取样本用以推断总体的方法称为抽样研究。 2.1.2 参数与统计量 统计指标 统计学中,把根据规定的函数关系计算出的描述总体或样本特征的函数值称为统计指标(index)。 参数 由总体资料计算出的统计指标称为参数(parameter),用于描述总体特征。 统计量 由样本资料计算出的统计指标称为统计量(statistic),用于描述样本特征 。 2.1.3 变异与误差 变异(variation) 变异指观测结果之间实际存在的差异。 误差(error) 误差指观测结果与真实值之差及统计量与参数之差。 过失误差(gross error)——过失误差可以避免; 系统误差(systematic error)——系统误差可以减少; 随机误差(random error)——随机误差无法消除。 2.2 常用的统计指标 2.2.1 平均数 2.2.2 变异数 2.2.3 相对数 2.2.1 平均数 定义 平均数(average)是表示观测值的平均水平的统计指标,常用的有算术平均数、几何均数及中位数。 2.2.1.1 算术均数 定义 算术均数(arithmetic mean),简称均数,常用、希腊字母μ表示,表示样本均数,μ表示总体均数。均数适用于正态分布资料统计。 计算方法 直接计算法 频数-加权计算法 直接计算法 当观察值的个数不多时,将所有观察值x1,x2,x3,…,xn直接相加,其和除以观察值的个数n,即为均数。 计算公式: 式中, 算术平均数 x1,…,xn 各观察值 ∑ 求和符号 ∑x 观察值总和 n 观察值的个数 频数-加权计算法 对一个随机事件作重复观察,其中某观察值出现的次数称频数; 各观察值对应的频数称为频数分布;显示各观察值对应的频数的表格称为频数分布表,简称频数表。 频数-加权计算法计算步骤 ① 计算全距 找出观察值中的最大值、最小值,并计算全距(range),全距=最大值-最小值。 ② 定组段数 一般取8~15个为宜,多取10个,组段数太多,计算较繁,组段数过少则误差较大。 ③ 定组距(class interval) 相邻两组段下限值之差为组距(class interval)。各组段的组距可以相等,也可以不等。若拟定为相等组距,则组距=全距/组段数,为便于观察值归组,组距常取整数。 ④ 定组段(class range) 即定各组数据的上下限,俗称“封口”。通常,某组段的最小值为下限(lower limit),相邻较大组段的下限即本组段的上限(upper limit)。第一组段应包括最小值,最末组段应包括最大值。 ⑤ 计数(fi) 划分组段后,将原始数据以适当方式划记计数(常用“正”字法)归组。得频数分布表。 ⑥ 计算组中值(Class mid-value)(xi) 组中值= ⑦ 计算均数 将各组段的频数与组中值之积相加求和,再除以总频数即得均数。 2.2.1.2 几何均数 定义 几何均数(geometric mean,G),也叫倍数均数,当观察值相差较大甚至成倍数关系时,如用算术均数表示其平均水平时受少数特大或特小值影响较大,则用几何均数来表示其平均水平。 计算步骤 先对观察值取数值,计算对数值的均数后,再查反对数,即得几何均数。 计算方法 直接计算法 频数表法 直接计算法 频数表法 当观察值较多时,可先编频数表,再按频数表计算几何均数。 2.2.1.3 中位数 定义 中位数(median,M,Md)指全部观察值按大小顺序排列,居于中间位置的数值。 偏态分布资料,一端或两端有不确定数值分布的资料,分布情况不清的资料,适宜用中位数统计。 计算方法 直接计算法 频数表法

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档