- 1、本文档共76页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十章 相关与回归分析精要
第十章 相关与回归分析 自然界与社会中的现象之间是相互联系的 本章讨论的是变量之间的关系 例子 学习时间和学习成绩之间的关系 企业广告投入与销售利润之间的关系 某地区人们的身高与体重之间的关系 粮食亩产量与施肥量之间的关系 饮水量与健康状况之间的关系 本章主要解决的问题 相关分析——有无关系 何种关系 关系的密切程度 回归分析——变量之间依存关系的描述 回归方程的拟合 第一节 相关分析 1.相关分析概述 1.1变量之间的关系 1.1变量之间的关系 相关关系的图示 1.2 相关关系的类型 1.3 相关关系的判定 例10.1:在研究我国人均消费水平的问题中,把全国人均消费额记为y,把人均GDP记为x。我们收集到1995-2003年的样本数据(xi ,yi),i =1,2,…,9,数据见表10-1,判断其相关关系的类型和密切程度。 1.3.1 直观判定——散点图(scatter plot) 又称相关图,将所研究变量的观察值以散点的形式画在相应的坐标系中,通过呈现的特征,来判断变量之间的相关情况。 1.3.2 统计判定——相关系数 相关系数:用以反映两变量间线性相关密切程度的统计指标,用r表示。 注意: 1.用以度量变量之间关系的密切程度 2.对两个变量之间的线性相关程度的度量指标称为简单相关系数 3.若计算的数据是总体数据,称为总体相关系数,记为ρ;若计算的数据是样本数据,称为样本相关系数,记为r。 样本相关系数的计算 例题的解 根据样本相关系数计算公式: 人均GDP和人均消费金额之间的相关系数为0.9938。 相关系数的取值及其意义 r 的取值范围是 [-1,1] |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负相关 r = 0,不存在线性相关关系 -1?r0,为负相关 0r?1,为正相关 |r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切 相关系数的取值及其意义 1.4 相关系数的显著性检验 检验两个变量之间是否存在线性相关关系 采用 t 检验 检验的步骤: 提出假设:H0:? ? ? ;H1: ? ? 0 相关系数的显著性检验 对前例计算的相关系数进行显著性检(??0.05) 1 提出假设:H0:? ? ? ;H1: ? ? 0 2 计算检验的统计量 对相关系数的几点说明 相关系数临界值表的使用 相关系数只能说明变量间线性相关的程度;r=0并不能否定其他线型的相关关系 相关关系不同于因果关系 注意 我们不能把回归分析看作是在变量间建立一个因果关系的过程。回归分析只能表明,变量是如何或者是以怎样的程度彼此联系在一起的。有关因果关系的任何结论,必须建立在理论分析的基础之上。 一元线性回归方程的显著性检验 (1)回归系数的显著性检验 提出假设: t检验的检验统计量 给定显著性水平,确定临界值 做出决策 一元线性回归方程的显著性检验 (2)回归方程的整体性检验 提出假设: 检验统计量:F-统计量 给定显著性水平,确定临界值 做出决策 利用回归方程进行估计和预测 (区间估计) 点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计 对于自变量 x 的一个给定值 x0,根据回归方程得到因变量 y 的一个估计区间 区间估计有两种类型 置信区间估计 预测区间估计 利用回归方程进行估计和预测(置信区间估计) ? y 的平均值的置信区间估计 利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值E(y0)的估计区间 ,这一估计区间称为置信区间 E(y0) 在1-?置信水平下的置信区间为 利用回归方程进行估计和预测(预测区间估计) ? y 的个别值的预测区间估计 利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个个别值的估计区间,这一区间称为预测区间 y0在1-?置信水平下的预测区间为 影响区间宽度的因素 1. 置信水平 (1 - ?) 区间宽度随置信水平的增大而增大 2. 数据的离散程度 (s) 区间宽度随离散程度的增大而增大 3. 样本容量 区间宽度随样本容量的增大而减小 4. 用于预测的 xp与?x的差异程度 区间宽度随 xp与?x 的差异程度的增大而增大 置信区间、预测区间、回归方程 离差平方和的分解 因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面 由于自变量 x 的取值不同造成的 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响 对一个具体的观测值来说,变差的大小可以通过该实际观测值与其
您可能关注的文档
- 第十章 正交试验设计精要.ppt
- 区域地理中国的交通人教版要点.ppt
- 第十章 VBA程序设计基础精要.ppt
- 区域地理—中国气候要点.ppt
- 第十章 三相电路1精要.ppt
- 第十章 会计基础-财务报表精要.ppt
- 区域经济学第一章要点.ppt
- 区域经济学课件要点.ppt
- 第十章 企业经营综合统计评价精要.ppt
- 区域地理野外实习报告(西安)要点.docx
- 五位一体教案教学教案设计.docx
- 思修与法基-教学教案分享.pptx
- 大学军事之《中国国防》题库分享.docx
- 2023版毛泽东思想和中国特色社会主义理论体系概论第五章-中国特色社会主义理论体系的形成发展.pdf
- 思修与法基 教学全案分享.docx
- 大学军事之《军事思想》题库分享.docx
- 《经济思想史》全套课件-国家级精品课程教案课件讲义分享.pdf
- 厦门大学国际金融全套资料(国家级精品课程)--全套课件.pdf
- 2023版毛泽东思想和中国特色社会主义理论体系概论第五章-中国特色社会主义理论体系的形成发展.docx
- 2023版毛泽东思想和中国特色社会主义理论体系概论第五章中国特色社会主义理论体系的形成发展分享.pdf
文档评论(0)