- 1、本文档共47页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
相关分析
12相关分析
§12.1相关系数的概念
§12.2使用模拟数据计算变量之间的相关系
数和绘图
§12.3使用本地数据计算变量之间的相关系
数和绘图
§12.4使用网上数据计算变量之间的相关系
数和绘图
12.1相关分析基本理论
(xix)(yiy)
r
22
(xix)(yiy)
12相关分析
12.3使用本地数据计算变量之间的
相关系数和绘图
12.4使用网上数据计算变量之间的相关系数
和绘图
13.1一元线性回归数据分析
§13.1.1一元线性回归分析基本理论
13.3一元线性回归分析基本理论
13.1一元线性回归分析基本理论
§例:某公司的分析师根据历史数据,做了
公司销售额增长率关于GDP增长率的线性
回归分析,得到截距为-3.2%,斜率为2,国
家统计局预测今年GDP增长率为9%,问该
公司今年销售额增长率预计为多少?
§答:Y=-3.2%+2X=-3.2%+2*9%=14.8%
2一元线性回归的假设
§任何模型都有假设前提,一元线性回归模型有以下6条假设:
§1.自变量X和因变量Y之间存在线性关系。
§2.残差项的期望值为0。残差=真实的Y值与预测的Y值之间的差,即
预测的误差。期望值为0即有些点在回归线的上方,有些点在回归线
的下方,且均匀围绕回归直线,这符合常理。
§3.自变量X与残差项不相关。残差项本身就是Y的变动中不能被X的
变动所解释的部分。
§4.残差项的方差为常数。这称为同方差性。如果残差项的方差不恒定,
称为异方差性。
§5.残差项与残差项之间不相关。如果残差项与残差项之间相关,称为
自相关或序列相关。
§6.残差项为正态分布的随机变量。
3方差分析
4决定系数
5估计的标准误
6回归系数的假设检验
§回归系数的假设检验是指检验回归系数
(截距和斜率)是否等于某个常数。通常
要检验斜率系数是否等于0(H0:b1=0),
这称为斜率系数的显著性检验。如果不能
拒绝原假设,即斜率系数没有显著的不等
于0,那就说明自变量X和因变量Y的线性
相关性不大,回归是失败的。
§例,我们做了一个线性回归模型,得到Y=0.2+1.4X。截
距系数的标准误为0.4,斜率系数的标准误为0.2,问截距
和斜率系数的显著性检验结果如何?,设显著性水平为
5%。
§答:截距系数的显著性检验:计算t统计量:
t=0.2/0.4=0.52(t检验的临界点),因此我们不能拒绝原
假设,即认为截距系数没有显著的不等于0。
§其次是斜率系数的显著性检验:计算t统计量:
t=1.4/0.2=72(t检验的临界点),因此我们拒绝原假设,
即认为斜率系数显著不等于0。这说明我们的回归做得不
错。
7回归系数的置信区间
§例如我们做了一个线性回归模型,得到Y=0.2+1.4X。截
距系数的标准误为0.4,斜率系数的标准误为0.2,求截距
和斜率系数的置信度为95%的置信区间。
§截距系数的置信区间,假设n充分大,5%的显著性水平
的t关键值一般近似为2,所以我们得到置信区间为:0.2,
即[-0.6,1.0]。
§0包括在置信区间中,所以我们认为截距系数没有显著的
不等于0。
§斜率系数的置信区间:1.4,即[1.0,1.8]。
§0没有包括在置信区间中,所以我们认为斜率系数显著的
不等于0。
13.2一元线性回归分析实例
13.3一元线性回归分析应用
xse12.231rs176.295
13.4多元线性回归数据分析
§13.1多元线性回归分析基本理论
§13.2多元线性回归数据分析
§13.3用Excel工具作多元回归分析
§13.4稳健线性回归分析
§13.5逻辑Logistic回归分析
§13.6广义线性回归分析
§13.7违背回归分析假设的计量检验
§13.8自相关性诊断与消除
§13.9异方差诊断与消除
§13.10多重共线性的诊断与消除
13.1多元线性回归分析基本理论
ˆˆˆˆ
yˆ01x12x2...mxmi
13.1虚拟变量
1,男性
D
0,女性
Y01X
文档评论(0)