- 1、本文档共35页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 回归分析课件
第8章 相关与回归分析回归分析广义上的回归分析,同时包括狭义的相关分析与回归分析的全部内容,亦即本章既研究现象间相互依存关系的密切程度,又研究现象之间数量相关的具体形式。;基本内容;第1节 变量间关系的度量一、变量间的相互关系;二、相关关系的描述与测度
1、散点图
2、相关系数
3、相关表;三、相关关系的显著性检验
1、提出假设
2、确定显著水平
3、计算统计量
4、比较
5、决策;第2节 一元线性回归分析(Simple linear regression) 一、一元线性回归模型(简单线性回归模型);2、一元线性回归方程(Simple linear regression equation)
描述y的均值E(y)与 x的关系的方程叫做回归方程。
由于
所以
不难看出,简单线性回归方程的图形是一条直线。这条直线被称为总体回归直线。 是回归直线的截距, 是回归直线的斜率,E(y)是给定某个x的值y的均值或期望值。
各实际观测点与总体回归线垂直方向的间隔,就是随机误差项ε,即
;3、估计一元线性回归方程(Estimated simple linear regression equation)
在实践中,参数往往是未知的,需要用样本数据进行估计。根据样本数据拟合的直线,称为样本回归直线。
分别为 的估计值,是样本回归直线的截距和斜率。
实际观测到的因变量y值,并不完全等于估计值 ,如果用e表示二者之差,则样本回归模型为: ; 样本回归模型与总体回归模型的区别:
第一,总体回归线是未知的,它只有一条;而样本回归线则是根据样本数据拟合的,可以有若干条样本回归线。
第二,总体回归模型中的β0和β1是未知的参数,表现为常数;而样本回归模型中的b0和b1是随机变量,其数值随样本观测值不同而变动。
第三,总体回归模型中的ε,是y与未知的总体回归线之间的纵向距离,它是不可直接观测的;而样本回归模型中的e,是y与样本回归线之间的纵向距离,可以根据样本观测值计算得出。; 二、一元线性回归模型的估计 1、回归系数的估计[例1] 假定我们想为某街区内的住宅房地产的销售价格y与评估价值x之间的关系建立一个回归模型,从去年已售出的房地产中随机抽选5所住宅作样本,相应的数据如表所示 。;直线回归分析步骤;例2:某乡为了提高小麦产量,经过多次试验,总结出一种小麦基本苗数推算成熟期有效穗数的方法。在5块田上进行对比试验,取得数据如下:;解:回归直线方程计算表(1);回归直线方程计算表(2);练习1:某企业上半年产品产量与单位成本数据如表所示。试根据表中数据:(1)绘制散点图;(2)建立回归方程,说明产量每增加1000件,单位成本平均变动如何?(3)作回归直线。;练习2: 根据Pizza连锁店的学生人数和季度销售收入数据,建立回归直线方程,并预测学生人数为25人时的销售收入。;练习3:以下是采集到的有关女子游泳运动员的身高(英寸)和体重(磅)的数据:a、用身高作自变量,画出散点图b、根据散点图表明两变量之间存在什么关系?c、试着画一条穿过这些数据的直线,来近似身高和体重之间的关系d、求出估计的回归方程e、如果一名运动员的身高是63英寸,你估计她的体重是多少?;2、总体方差的估计;例3:根据例1数据计算s2和s。;三、一元线性回归模型的检验;1、拟合程度的评价 ; 两个变量之间线性相关的强弱可以用相关系数r(Correlation coefficient)度量。
相关系数(样本中 x与y的线性关系强度)计算公式如下:
相关系数的取值范围在-1≤r≤1之间。当r接近于0时,说明x与y之间不相关;当r=1或r=-1时,说明x与y完全相关;当-1r1时,说明x与y之间不完全相关。
测定系数与相关系数之间的区别
第一,二者的应用场合不同。当我们只对测量两个变量之间线性关系的强度感兴趣时,采用相关系数;当我们想要确定最小二乘直线模型同数据符合的程度时,应用测定系数。
第二,相关系数仅限定于两个变量之间存在线性关系,而测定系数却可以应用于线性、非线性相关和自变量是两个和两个以上的复相关。
;2、显著性检验; t检验的根据是:统计量t=(b1-β1)/ sb1服从自由度为(n-2)的t分布。若零假设为真,即β1=0,则t= b1/ sb1。如果|t|>tα/2(临界值),则拒绝
您可能关注的文档
最近下载
- 【课件】牛顿第一定律+说课课件人教版物理八年级下册.pptx VIP
- 2024《双职工家庭亲子关系问题及其对策—以S社区为例》8900字.docx
- 机油泵行业发展趋势及前景展望分析报告.pptx
- 小学数学新人教版一年级下册全册教案(2025春).doc
- 人教部编版三年级下册语文课件-教材解读及教学建议(思维导图).pptx
- 招标代理服务方案.pdf VIP
- 2025年江西工业贸易职业技术学院单招职业适应性测试题库word版.docx VIP
- 人体寄生虫学(第9版)PPT课件 华支睾吸虫.pptx
- 2024宁夏消防救援总队全媒体工作中心面向社会公开招聘消防文员笔试备考题库及答案解析.docx
- 2022年湖南铁路科技职业技术学院单招职业技能模拟试题及答案解析.docx
文档评论(0)