2007统计学第11章.docVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2007统计学第11章

PAGE  PAGE 10 第十一章 相关与回归分析 §1 变量间的相关关系 变量相关的概念 社会经济现象或自然现象中,一些变量与另一些变量存在着内在的联系.这种联系的紧密程度一般各不相同.一种极端的情况是,一个变量或一些变量的变化能完全决定另一个变量的变化,即所谓函数关系,如产品销售收入被产品价格和销量完全确定.另一种情况是,一个变量或一些变量的变化能基本或大致决定另一个变量的变化,我们称变量间的这种关系为统计依存关系(相关关系),如居民消费水平与收入的关系,粮食产量与施肥量的关系等等.统计依存关系往往被用来描述一个随机变量与一个或几个确定型变量之间的关系. 现代统计中关于变量间的这种统计依存关系的研究可分为两个分支——相关分析与回归分析。 在实际应用中,相关分析与回归分析方法经常被相互结合和渗透,但它们研究的侧重点和应用面有所不同。它们的差别主要有: 回归分析中,变量的地位不对等,一个变量是被解释变量(因变量,它往往是一个随机变量),另一个或一组变量为解释变量(它们往往是确定型变量);而在相关分析中,被研究的变量处于同等地位,而且它们通常都是随机变量。 回归分析中,被解释变量是一个随机变量,解释变量往往是确定型变量;而在相关分析中,被研究的变量通常都是随机变量。 相关分析主要是研究变量间某种相关关系的密切程度(如线性相关,等级相关等);而回归分析主要是研究变量间相关关系的具体形式(如线性相关,指数相关)。 二、相关系数及其计算 本书中所定义的相关系数可衡量两个变量的线性相关程度。 设随机变量y与x之间存在着某种相关关系.对于x的取定的一组不完全相同的值作独立试验得到n对观察结果,其中yi是处对随机变量y的观察结果.我们称这n对结果为一个容量为n的样本. 将一个样本作为一个点集在平面直角坐标系描出得到的图形就是散点图.散点图可以帮助我们粗略地看出y与x相关的形式. 对随机变量y与x的一个样本,我们定义y与x的(样本)相关系数如下: 的值介于-1与1之间, 的绝对值越大,两个变量的线性相关程度越高. 的正负还可以反映两个变量的相关方向, 说明两个变量正相关; 说明两个变量负相关. 的值的大小与样本容量的大小有关,一般地,在相同的相关程度下,的值随着样本容量的增大而减小。 在判定两个变量的相关程度时,还要进行相关系数检验,也就是说,对给定的显著性水平和样本容量只有当的绝对值大过某个临界值时,才能认为变量之间有显著的线性相关关系。这个相关系数可以通过相关系数检验表查出。 有必要指出,相关系数的大小只反映两个变量的线性相关关系的强弱,在的绝对值较小时,两个变量可能还有其他统计相关关系. 例 考虑我国人均国民收入和人均消费金额的线性相关程度。 我国人均国民收入和人均消费金额数据 年份人均国民 收入人均消费 金额年份人均国民 收入人均消费 金额1981 1982 1983 1984 1985 1986 1987393.8 419.14 460.86 544.11 668.29 737.73 859.97249 267 289 329 406 451 5131988 1989 1990 1991 1992 19931068.8 1169.2 1250.7 1429.5 1725.9 2099.5643 699 713 803 947 1148 经计算, 取显著性水平,查相关系数检验表,得临界值(n=13,因而自由度为13-2=11)为0.553. 所以可以认为两变量有十分显著的线性相关关系。 相关系数的检验也可以通过其他方法进行,由下一节内容可知 ~, ~, 所以,可以通过计算这两个统计量的值并与临界值或来检验相关系数的显著性。 例11-6 不良贷款的相关因素分析  HYPERLINK 回归分析.xls 回归分析.xls(sheet2) §2 一元线性回归 一、一元线性回归模型 在上一节,我们已经提到,回归分析就是要研究变量间具体的相关形式。为此,当考虑两个变量的相关关系时,我们可以先通过已有数据画出散点图,大致得出两个变量的相关形式,如上例中的数据的散点图如下: 从上图可以看出我国人均国民收入和人均消费金额大致呈线性相关关系。 下图给出了几种可能的相关关系. 上面的前三幅图有一个共同的特点,那就是,y1,y2,y3与x的关系可大致表示为一个确定的函数关系和一个随机扰动的和,即 这里,,是服从均值为0, 方差为,的正态随机变量. 这就启发我们将变量y与x的相关关系用一个y关于x的函数与一个服从均值为0的正态随机变量的和表示出来.这个表示式即所谓回归模型.特别地,如果y关于x的函数是线性的,则所得的模型即为(简单)线性回归模型. 一个随机变量y关于另一个

文档评论(0)

185****7617 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档