讲地球化学数据统计基础.pptVIP

下载本文档

5
0
约3.34千字
约 24页
2017-11-23 发布于江苏
举报
版权申诉

讲地球化学数据统计基础.ppt

1、本文档共24页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

讲地球化学数据统计基础

地球化学数据统计分析与解释龚庆杰推荐用书《数据统计分析与SPSS应用》余建英何旭宏编著人民邮电出版社出版第一讲地球化学数据统计基础一、地化数据的特点各种地球化学特征在不同的研究对象（样品或测点）上进行测试，可以得到各自的数值。这种在不同对象上可以取值的地球化学特征称为地球化学变量。地球化学变量具有3个特点。即它具有随机变量的性质，又具有确定性变量的特征，还具有区域化变量的结构性。随机性 1.地球化学样品的采取具有抽样的性质 2.从成因上看，地球化学变量的取值受多因素的控制 3.地球化学变量在测试过程中有测试误差，误差就带有随机性特点确定性每一个研究对象在指定的时刻，某种地球化学特征的真实数值是客观存在的，是有确定数值的。这个值不依赖于人们是否已经测试到了。区域结构性所谓结构性是指地球化学变量由于受地质因素的控制，在不同方向上变化率的不同，具有不同的自相关的特性。当一个变量分布在空间内时（即赋于其空间位置时），称为区域化变量二、地球化学变量的分类按取值范围内的可能，分为3类： 1.连续型变量连续型变量在取值范围内有不可数无限多个值。这种变量可以取在某一个数值区间内的任何数值。 2.离散型变量离散型变量在取值范围内取有限多个或可数无限个值。 3.二元变量二元变量也称二态变量或有无变量，它是一种只有两个取值的离散变量。根据给予某个变量具体数值的方式，划分为4类：为叙述方便，先设变量x在两个观测对象A与B中的取值分别为xA和xB。 1.名义型变量名义型变量把观测值分成互不相交的组别。这些组别可以用它们的名字、特征或符号来标识。 2.有序型变量有序型变量对观测特征可以列出一个等级大小的顺序。对于A和B两个对象，它不仅能区别出xA=xB或xA≠xB，还能进一步区分出xAxB或xAxB，即有了大小顺序的差别。但它们的级差不是等距的。 3.间隔型变量间隔型变量不但能区分它们之间的值是相等、不等、谁大谁小，而且还能表示谁比谁大多少。间隔型变量可以定量地表示它们之间的差异，但间隔型变量没有绝对零值。 4.比例型变量比例型变量比间隔型变量更进一步。它具有间隔型变量的标识功能，而且还有真正的零点。以上4类变量中，名义型变量和有序型变量属于定性变量，间隔型变量和比例型变量为定量变量。一般来说，定性变量只能参加布尔运算，定量变量可作代数运算。地球化学变量按其预处理取值方法的不同还可以分为： 1.实测变量它又叫观察变量或原始变量。它是用仪器或特定的分析手段对研究对象直接测定所得。 2.综合变量综合变量是将两个或多个原始观察值加以综合，组成一个新的变量，具有特定的地质意义。 3.人为变量它是根据地质人员对地质现象和成矿理论人为确定的变量。地球化学数据统计的基本内容数据统计基础方差分析相关分析回归分析聚类分析判别分析因子分析统计描述 1.均值（Mean）和均值标准误差（S.E.mean）定义：均值（平均值、平均数）表示的是某变量所有取值的集中趋势或平均水平。计算公式：总体平均数期望：样本平均数：统计描述 2.中位数（Median）定义：把一组数据按递增或递减的顺序排列，处于中间位置上的变量值就是中位数。它是一种位置代表值，所以不会受到极端数值的影响，具有较高的稳健性。计算公式：一个大小为N的数列，要求其中位数，首先应把该数列按大小顺序排列好，如果N为奇数，那么该数列的中位数就是(N+1)/2位置上的数；如果N为偶数，中位数则是该数列中第N/2与第N/2+1位置上两个数值的平均数统计描述 3.众数（Mode）定义：众数是指一组数据中，出现次数最多的那个变量值。众数在描述数据集中趋势方面有一定的意义。计算公式：手工计算众数比较麻烦，需要统计数据的次数分布。统计描述 4.全距（Range）定义：全距也称为极差，是数据的最大值与最小值之间的绝对差。在相同样本容量情况下的两组数据，全距大的一组数据要比全距小的一组数据更为分散。计算公式： Range=最大值-最小值统计描述 5.方差（Variance）和标准差（Standard Deviation）定义：方差是所有变量值与平均数偏差平方的平均值，它表示了一组数据分布的离散程度的平均值。标准差是方差的平方根，它表示了一组数据关于平均数的平均离散程度。方差和标准差越大，说明变量值之间的差异越大，距离平均数这个“中心”的离散趋势越大。统计描述 6.四分位数（Quartiles）、十分位数（Deciles）和百分位数（Pe