网站大量收购独家精品文档,联系QQ:2885784924

第八章 回归分析课件.ppt

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 回归分析课件

第8章 相关与回归分析 回归分析广义上的回归分析,同时包括狭义的相关分析与回归分析的全部内容,亦即本章既研究现象间相互依存关系的密切程度,又研究现象之间数量相关的具体形式。 ;基本内容; 第1节 变量间关系的度量 一、变量间的相互关系;二、相关关系的描述与测度 1、散点图 2、相关系数 3、相关表;三、相关关系的显著性检验 1、提出假设 2、确定显著水平 3、计算统计量 4、比较 5、决策;第2节 一元线性回归分析(Simple linear regression) 一、一元线性回归模型(简单线性回归模型);2、一元线性回归方程(Simple linear regression equation) 描述y的均值E(y)与 x的关系的方程叫做回归方程。 由于 所以 不难看出,简单线性回归方程的图形是一条直线。这条直线被称为总体回归直线。 是回归直线的截距, 是回归直线的斜率,E(y)是给定某个x的值y的均值或期望值。 各实际观测点与总体回归线垂直方向的间隔,就是随机误差项ε,即 ;3、估计一元线性回归方程(Estimated simple linear regression equation) 在实践中,参数往往是未知的,需要用样本数据进行估计。根据样本数据拟合的直线,称为样本回归直线。 分别为 的估计值,是样本回归直线的截距和斜率。 实际观测到的因变量y值,并不完全等于估计值 ,如果用e表示二者之差,则样本回归模型为: ; 样本回归模型与总体回归模型的区别: 第一,总体回归线是未知的,它只有一条;而样本回归线则是根据样本数据拟合的,可以有若干条样本回归线。 第二,总体回归模型中的β0和β1是未知的参数,表现为常数;而样本回归模型中的b0和b1是随机变量,其数值随样本观测值不同而变动。 第三,总体回归模型中的ε,是y与未知的总体回归线之间的纵向距离,它是不可直接观测的;而样本回归模型中的e,是y与样本回归线之间的纵向距离,可以根据样本观测值计算得出。; 二、一元线性回归模型的估计 1、回归系数的估计 [例1] 假定我们想为某街区内的住宅房地产的销售价格y与评估价值x之间的关系建立一个回归模型,从去年已售出的房地产中随机抽选5所住宅作样本,相应的数据如表所示 。 ;直线回归分析步骤 ;例2:某乡为了提高小麦产量,经过多次试验,总结出一种小麦基本苗数推算成熟期有效穗数的方法。在5块田上进行对比试验,取得数据如下:;解:回归直线方程计算表(1);回归直线方程计算表(2);练习1:某企业上半年产品产量与单位成本数据如表所示。试根据表中数据: (1)绘制散点图; (2)建立回归方程,说明产量每增加1000件,单位成本平均变动如何? (3)作回归直线。;练习2: 根据Pizza连锁店的学生人数和季度销售收入数据,建立回归直线方程,并预测学生人数为25人时的销售收入。;练习3:以下是采集到的有关女子游泳运动员的身高(英寸)和体重(磅)的数据: a、用身高作自变量,画出散点图 b、根据散点图表明两变量之间存在什么关系? c、试着画一条穿过这些数据的直线,来近似身高和体重之间的关系 d、求出估计的回归方程 e、如果一名运动员的身高是63英寸,你估计她的体重是多少? ;2、总体方差的估计 ;例3:根据例1数据计算s2和s。 ;三、一元线性回归模型的检验 ;1、拟合程度的评价 ; 两个变量之间线性相关的强弱可以用相关系数r(Correlation coefficient)度量。 相关系数(样本中 x与y的线性关系强度)计算公式如下: 相关系数的取值范围在-1≤r≤1之间。当r接近于0时,说明x与y之间不相关;当r=1或r=-1时,说明x与y完全相关;当-1r1时,说明x与y之间不完全相关。 测定系数与相关系数之间的区别 第一,二者的应用场合不同。当我们只对测量两个变量之间线性关系的强度感兴趣时,采用相关系数;当我们想要确定最小二乘直线模型同数据符合的程度时,应用测定系数。 第二,相关系数仅限定于两个变量之间存在线性关系,而测定系数却可以应用于线性、非线性相关和自变量是两个和两个以上的复相关。 ;2、显著性检验 ; t检验的根据是:统计量t=(b1-β1)/ sb1服从自由度为(n-2)的t分布。若零假设为真,即β1=0,则t= b1/ sb1。如果|t|>tα/2(临界值),则拒绝

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档