《回归分析的基本思想及其初步应用》文字2素材.docVIP

《回归分析的基本思想及其初步应用》文字2素材.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《回归分析的基本思想及其初步应用》文字2素材.doc

阐释回归分析的基本思想 在客观世界中,变量间总是相互联系、相互依存的。变量之间的关系大致可以分为两类:一类是具有确定性的函数关系,另一类是非确定性的关系。非确定性的关系在统计学中称为相关关系。回归分析就是通过分析、判断来确定相关变量之间的内在关系的一种统计方法,即寻找相关关系中非确定性关系的某种确定性。   1 相关关系与函数关系的异同点:   相同点:均是指两个变量的关系。   不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系。   2 散点图:表示具有相关关系的两个变量的一组数据的图形,叫做散点图,散点图形象地反映了各对数据的密切程度。   3 求回归直线方程的思想方法:  设所求的直线方程为 ,其中a、b是待定系数,   则? ,于是得到各个偏差   ??? ,   显见,偏差 的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用n个偏差的平方和    表示n个点与相应直线在整体上的接近程度。   记?   上述式子展开后,是一个关于a、b的二次多项式,采用配方法,可求出使Q为最小值时的a、b的值,即    其中 。 4 随机误差:当样本点散布在某一条直线的附近,而不是在一条直线上时,可用下面的线形回归模型来表示: y=bx+a+e 其中a和b为模型的未知参数,e称为随机误差。 5 相关系数: 对于任何给定的一组样本()( i =1,2,…n )都可以用最小二乘法建立起一个线性回归模型,相应地就可以得到一条回归直线。但是,这样的一条回归直线并不是总有意义的,只有当变量X与Y之间确实存在某种因果关系时,其回归直线才有意义。统计学中要确定变量X和Y之间是否确实存在线性相关,通常利用相关系数来检验。相关系数记作,它能够较精确地描述两个变量之间线性相关的密切程度。当0时称Y与X正相关;当0时称Y与X是负相关。 线性回归模型的残差原因: 第一是所选择的数学模型不适合,变量间不是线性关系而建立了线性模型;第二是模型中所包含的自变量数目不合适,或是遗漏了某些重要的影响因素,或是包含了不必要的其他因素等。一般地,残差平方和越小的模型,拟和的效果越好;类似地,还可用R2来比较两个模型的拟和效果,R2越大,模型的拟和效果也越好。 建立回归模型的步骤: 确定研究对象,明确解释变量、预报变量; 画出确定好的解释变量和预报变量的散点图,观察是否存在线性关系等; 确定回归方程的类型; 按一定的规则估计回归方程中的参数; 得出结果后分析残差图是否有异常,若存在异常,则探明原因。 ); 4.按一定规则估计回归方程中的参数(如最小二乘法); 5.得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等等),若存在异常,则检查数据是否有误,或模型是否合适等。 例1 在彩色显影中,由经验可知:形成染料光学密度与析出银的光学密度由公式表示,现测得试验数据如下: 0.05 0.06 0.25 0.31 0.07 0.10 0.38 0.43 0.14 0.20 0.47 0.10 0.14 1.00 1.12 0.23 0.37 1.19 1.25 0.59 0.79 1.29 试求对的回归方程。 分析:该例是一个非线性回归分析问题,由于题目中已给定了要求的曲线为类型,我们只要通过所给的11对样本数据,求出和即可确定与的相关关系的曲线方程。 解析:由题意可知,对于给定的公式两边取自然对数,得。 与线性回归方程对照可以看出,只要取,,就有,这是的线性回归直线方程,对此我们再套用相关性检验,求回归系数和。 题目中所给数据由变量置换,变为如下所示的数据: 20.000 16.667 4.000 3.226 14.286 10.000 -2.303 -1.966 0.000 0.113 -1.470 -0.994 2.632 2.326 7.143 5.000 2.128 0.174 0.223 -0.528 -0.236 0.255 可以求得。 由于,可知与具有很强的线性相关关系。 再求得, ∴,把和置换回来可得, ∴, ∴回归曲线方程为。 评注:解决本题的思路是通过适当的变量置换把非线性回归方程转化为线性回归方程,然后再套用线性回归分析的解题步骤。 例2 某种书每册的成本费(元)与印刷册数(千册)有关,经统计得到数据如下: 1 2 3 5 10 20 30 50 100 200 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.3

文档评论(0)

天马行空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档