讲地球化学数据统计基础.pptVIP

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
讲地球化学数据统计基础

地球化学数据 统计分析与解释 龚庆杰 推荐用书 《数据统计分析与SPSS应用》 余建英 何旭宏 编著 人民邮电出版社 出版 第一讲 地球化学数据统计基础 一、地化数据的特点 各种地球化学特征在不同的研究对象(样品或测点)上进行测试,可以得到各自的数值。这种在不同对象上可以取值的地球化学特征称为地球化学变量。 地球化学变量具有3个特点。即它具有随机变量的性质,又具有确定性变量的特征,还具有区域化变量的结构性。 随机性 1.地球化学样品的采取具有抽样的性质 2.从成因上看,地球化学变量的取值受多因素的控制 3.地球化学变量在测试过程中有测试误差,误差就带有随机性特点 确定性 每一个研究对象在指定的时刻,某种地球化学特征的真实数值是客观存在的,是有确定数值的。这个值不依赖于人们是否已经测试到了。 区域结构性 所谓结构性是指地球化学变量由于受地质因素的控制,在不同方向上变化率的不同,具有不同的自相关的特性。当一个变量分布在空间内时(即赋于其空间位置时),称为区域化变量 二、地球化学变量的分类 按取值范围内的可能,分为3类: 1.连续型变量 连续型变量在取值范围内有不可数无限多个值。这种变量可以取在某一个数值区间内的任何数值。 2.离散型变量 离散型变量在取值范围内取有限多个或可数无限个值。 3.二元变量 二元变量也称二态变量或有无变量,它是一种只有两个取值的离散变量。 根据给予某个变量具体数值的方式,划分为4类: 为叙述方便,先设变量x在两个观测对象A与B中的取值分别为xA和xB。 1.名义型变量 名义型变量把观测值分成互不相交的组别。这些组别可以用它们的名字、特征或符号来标识。 2.有序型变量 有序型变量对观测特征可以列出一个等级大小的顺序。对于A和B两个对象,它不仅能区别出xA=xB或xA≠xB,还能进一步区分出xAxB或xAxB,即有了大小顺序的差别。但它们的级差不是等距的。 3.间隔型变量 间隔型变量不但能区分它们之间的值是相等、不等、谁大谁小,而且还能表示谁比谁大多少。间隔型变量可以定量地表示它们之间的差异,但间隔型变量没有绝对零值。 4.比例型变量 比例型变量比间隔型变量更进一步。它具有间隔型变量的标识功能,而且还有真正的零点。 以上4类变量中,名义型变量和有序型变量属于定性变量,间隔型变量和比例型变量为定量变量。一般来说,定性变量只能参加布尔运算,定量变量可作代数运算。 地球化学变量按其预处理取值方法的不同还可以分为: 1.实测变量 它又叫观察变量或原始变量。它是用仪器或特定的分析手段对研究对象直接测定所得。 2.综合变量 综合变量是将两个或多个原始观察值加以综合,组成一个新的变量,具有特定的地质意义。 3.人为变量 它是根据地质人员对地质现象和成矿理论人为确定的变量。 地球化学数据统计的基本内容 数据统计基础 方差分析 相关分析 回归分析 聚类分析 判别分析 因子分析 统计描述 1.均值(Mean)和均值标准误差(S.E.mean) 定义:均值(平均值、平均数)表示的是某变量所有取值的集中趋势或平均水平。 计算公式: 总体平均数期望: 样本平均数: 统计描述 2.中位数(Median) 定义: 把一组数据按递增或递减的顺序排列,处于中间位置上的变量值就是中位数。它是一种位置代表值,所以不会受到极端数值的影响,具有较高的稳健性。 计算公式: 一个大小为N的数列,要求其中位数,首先应把该数列按大小顺序排列好,如果N为奇数,那么该数列的中位数就是(N+1)/2位置上的数;如果N为偶数,中位数则是该数列中第N/2与第N/2+1位置上两个数值的平均数 统计描述 3.众数(Mode) 定义: 众数是指一组数据中,出现次数最多的那个变量值。众数在描述数据集中趋势方面有一定的意义。 计算公式: 手工计算众数比较麻烦,需要统计数据的次数分布。 统计描述 4.全距(Range) 定义: 全距也称为极差,是数据的最大值与最小值之间的绝对差。在相同样本容量情况下的两组数据,全距大的一组数据要比全距小的一组数据更为分散。 计算公式: Range=最大值-最小值 统计描述 5.方差(Variance)和标准差(Standard Deviation) 定义: 方差是所有变量值与平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值。标准差是方差的平方根,它表示了一组数据关于平均数的平均离散程度。方差和标准差越大,说明变量值之间的差异越大,距离平均数这个“中心”的离散趋势越大。 统计描述 6.四分位数(Quartiles)、十分位数(Deciles)和百分位数(Pe

文档评论(0)

phltaotao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档