- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
利用回归分析对金属的含量在矿脉中的分布的研究
摘要
本文主要采用先利用Spss16.0分别画出关于y 的散点图,判断两者的线性关系,我们将采用回归分析和方差分析,用统计分析决定其拟合程度并作出修正。
通过观察散点图我们可以得出两者具有很明显的线性关系,因此作出假设模型,利用Matlab7.6编写程序(见附录一)得出模型合理的结果,紧接着通过观察残差分布图(见附录二)发现第一组数据不合理,因此我们对其进行剔除,并对剔除后的数据进行重新统计分析,得出剔除第一组数据后的模型更合理的结果。
关键词:回归分析 残差分析
问题重述
一般而言,金属的含量在矿脉中的分布是不均匀的。现一矿脉有13个相邻样本点,人为地设定一原点,现测得各样本点对原点的距离x与该样本点处某种金属含量y 的一组数据如表一,画出散点图观测二者的关系,试建立合适的回归模型,如二次曲线、双曲线、对数曲线等。
表一
2
3
4
5
7
8
10
106.42
109.20
109.58
109.50
110.00
109.93
110.49
11
14
15
16
18
19
110.59
110.60
110.90
110.76
111.00
111.20
问题假设
1、只考虑距离对其影响,忽略湿度、土质等其他影响;
2、数据误差在可允许范围内;
三、符号说明和名称解释
、:为回归系数;
b :回归系数估计值;
:判定系数;
F:检验统计量;
P:与F 对应的概率;
:剩余方差;
四、模型的建立和求解
4.1问题的分析
题目中已经给出了各样本点对原点的距离x与该样本点处某金属含量y 的数据表,画出散点图便可以直接明了的观察出两者是否具有线性关系。并通过观察拟合确定其回归模型。
4.2问题的求解
利用Spss16.0绘制各样本点对原点的距离x与该样本点处某金属含量y 的散点图,结果如下:
可以看出两者具有很明显的线性关系,因此,我们建立线性回归模型:
(1)
利用Matlab7.6编写程序(程序见附录一)可得:
b = 108.2726
0.1714
bint =107.2936 109.2517
0.0870 0.2558
stats =0.6450 19.9873 0.0009 0.602
即:=108.2726,=0.1714, :的置信区间为[107.2936,109.2517],的置信区间为[0.0870,0.2558], =0.6450 , F =19.9873, p =0.0009, =0.602。
4.2.1模型的检验
当较大时原数据的总变异基本可以由拟合值的变异来解释,并且残差较小,即拟合点与原数据吻合程度高。p =0.0009较小拒绝原假设模型不成立。因此模型(1)成立。
观察命令rcoplot(r,rint)所画的残差分布(见附录二),除第1个数据外其余残差的置信区间均包含零点,第1个点应视为异常点,将其剔除后重新计算,可得
b =109.0778
0.1140
bint =108.8292 109.3264
0.0934 0.1346
stats = 0.9382 151.7945 0.0000 0.0289
对剔除第一组后数据编写程序(程序见附录三)的观察重新计算后的残差分布图(见附录四)可以得出剔除后的数据更合理
应该用修改后的这个结果:
表二
3
4
5
7
8
10
109.20
109.58
109.50
110.00
109.93
110.49
14
15
16
18
19
110.60
110.90
110.76
111.00
111.20
所以模型应该为:=109.0778+0.1140
五、模型的分析、评价与推广
该模型简单并且拟合程度较好,可以解决一般的线性问题。只要采用的模型和数据相同,通过标准的统计方法可以计算出唯一的结果。除此之外还可以准确地计量各个因素之间的相关程度与回归拟合程度的高低,提高预测方程式的效果。
不足之处是但在图和表的形式中,数据之间关系的解释往往因人而异,不同分析者画出的拟合曲线很可能是不一样的,而且有时候在回归分析中,选用何种因子和该因子采用何种表达式只是一种推测,这影响了因子的多样性和某些因子的不可测性,使得回归分析在某些情况下受到限制[1]。
参考文献
[1]回归分析优缺点 /view/b472747a168884868762d66a.html附录
附录一、
x1=[2 3 4 5 7 8
文档评论(0)