- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
讲义相关与回归
第六章 相关与回归
相关和回归分析是研究事物的相互关系,测定它们联系的紧密程度,揭示其变化的具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。
本章介绍相关和回归分析的基本原理和系统分析的方法。
第一节 相关的概念和二元概率分布
1.什么是相关关系?
变量之间关系
函数关系
相关关系
共变关系
互为因果关系
因果关系
确定性依存关系 不确定(随机性)依存关系
2.相关关系种类
正 相 关
一元相关
线性相关
负 相 关
多元相关
曲线相关
正相关 负相关 曲线相关 不相关
3.二元概率分布
例:某企业200名职工的企业工龄和时工资的分布
企业工龄
(年)x 时工资级别(元)y 总计 1 2 3 1 20(0.10) 0(0) 0(0) 20(0.10) 2 40(0.20) 10(0.05) 0(0) 50(0.25) 3 24(0.12) 24(0.12) 12(0.06) 60(0.30) 4 16(0.08) 26(0.13) 8(0.04) 50(0.25) 5 0(0) 0(0) 20(0.10) 20(0.10) 总计 100(0.50) 60(0.30) 40(0.20) 200(1)
二元概率分布的5个特征值:
x的数学期望:
y的数学期望:
x的方差:
y的方差:
(5)x与y的协方差:
可度量x与y之间的线性相关关系
第二节 简单线性相关
一、相关系数
协方差σxy可表明x、y的“共变性”和线性相关的方向。但不是一个适用于比较的相关关系的量度。积矩相关系数是对它的改进。
未分组资料:
分组资料:
二、相关系数的检验(t检验)
H0 : p=0, H1 : p≠0
检验统计量
第三节 一元线性回归模型
一、回归的概念和回归分析的特点
回归分析和相关分析的联系和区别
联 系 区 别 理论和方法具有一致性;
无相关就无回归,相关程度越高,回归越好;
相关系数和回归系数方向一致,可以互相推算。 相关分析中,x与y对等,回归分析中,x与y要确定自变量和因变量;
相关分析中x,y均为随机变量,回归分析中,只有y为随机变量;
相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。 二、一元线性回归模型
(一)一元线性回归模型的性质
回归系数b表明自变量x每变化一个单位因变量y的增(减)量。
1.b与r的关系:
r>0
b>0 r<0
b<0 r=0
b=0
2.是理论模型,表明x与y两变量之间的平均变动关系。
(实际值):
(二)一元线性回归模型的确定
根据实际数据,用最小平方法,即使 ,分别对a、b求编导并令其为零,求得两个标准方程:
解联立方程,得到
三、判定系数(r2)和估计标准误(Sxy)
(一)判定系数(r2)
判定系数是对回归模型拟合优度的评价。
总偏差 = 回归偏差 + 剩余偏差
r2表示全部偏差中有百分之几的偏差可由x与y的回归关系来解释。
(二)估计标准误(Sxy)
Sxy是二元正态分布中因变量实际值(yj)对估计值( )离散程度的量度。
Sxy 越小, 拟合越好;
Sxy 越大, 拟合越差。
Sxy也是用自变量对因变量进行区间估计的抽样误差。
四、一元线性回归模型的显著性检验
(一)回归系数b的检验
设总体回归系数为β0 H0:β=0;H1:β≠0
1.n≥30时
检验统计量 (β=0)
σb是样本回归系数抽样分布的标准差。通常是未知的,用其估计量 代替。
给定显著性水平α,查Z表可知其临界值 。
2.n<30时
检验统计量 (β=0)
给定显著性水平α,查t表可知其临界值 。
(二)回归模型整体的F检验
或
(可见,F检验实质上是对总体回归模型H0:R2=0的检验。)
五、应用一元回归模型进行区间估计
1.n≥30时
您可能关注的文档
最近下载
- 【行业标准】NBT 47041-2014 塔式容器.pdf
- 内蒙古版三年级综合实践活动指导第3单元主题活动四《多彩的泡泡》.ppt
- 老年痴呆护理查房ppt.pptx
- 感冒药的正确使用.pdf
- 调色师:达芬奇视频剪辑调色从入门到精通第11章 综合案例:制作《云彩之美》效果.pptx VIP
- 调色师:达芬奇视频剪辑调色从入门到精通第10章 综合案例:制作《银河星空》延时效果.pptx VIP
- 2020年上海黄浦区高三二模语文试卷(答案、解析版).pdf VIP
- 调色师:达芬奇视频剪辑调色从入门到精通第9章 抖音热门调色.pptx VIP
- (正式版)G-B 4839-2009 农药中文通用名称.docx VIP
- 语文一年级上册核心素养教案全册.pdf VIP
文档评论(0)