- 1、本文档共58页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章 相关和回归5.13
区别 ①相关分析所研究的变量是对等关系;回归分析所研究的两个变量不是对等关系。 ②对两个变量来说,相关分析只能计算出一个相关系数,而回归分析,可分别建立两个不同的回归方程。 ③相关分析要求两个变量都必须是随机的,而回归分析的要求,自变量是给定的,因变量是随机的。 一、直线回归的模型 一元线性回归模型是最简单的回归模型,又称为简单线性回归或简单回归:只有一个自变量的直线回归。 在一元线性回归模型中,X为可以精确测定和控制的变量,且当X取得某确定值时,对应的Y值相互独立,服从正态分布。 图6-8 简单线性回归统计学模型 μy=α+βx 总体回归方程 样本直线回归方程 a:截距(intercept)。 b:斜率(slope),回归系数 x每改变1个单位时y平均改变b个单位。 b0表示自变量↑应变量↑ ,直线上升。 │b│↑→越陡→ y随x变化率大。 b=0,表示回归直线与X轴平行,即X与Y无直线关系。 二、直线回归分析的应用条件: 1、XY具有线性相关关系 2、对于每一个确定的X,相应的Y值间独立 3、Y值具有正态性。 4、对于任意一组自变量值,因变量Y具有相同的方差 三、直线回归方程的建立、检验与应用 1.建立:最小二乘法原则,使各个实测点到回归直线纵向距离的平方和最小。a,b的计算公式由此推导出来。 2.应用:在样本数据范围内。 3.检验:用样本数据建立的直线回归方程是样本方程,样本方程是否能在总体上反应两个变量之间的直线回归关系,需要对样本方程进行假设检验。 (1)回归方程的假设检验采用方差分析。 (2)将总的变异SS总分解为SS回归和SS剩余,然后利用F检验来判断回归方程是否成立。 4.对回归方程总体进行假设检验以后,需要对回归系数b进行检验。 回归系数的检验采用t检验。 假设β=0,即X和Y之间不存在依存关系。 5.b为总体回归系数β的点估计,可用公式6-15对总体回归系数β做区间估计。 6.决定系数(R2) R2 = SS回 /SS总 = (SS总-SS剩 )/SS总 =1-SS剩 / SS总 。 R2表示y的总变异中被x所决定的部分占多少比例。 0≤R2 ≤ 1, → 1,回归效果越好,模型对数据的拟合效果越好,用回归方程进行预测也越有意义。R2 是评价回归效果的重要的指标。 对例题6-1的资料做直线回归分析 1、考察资料是否满足应用条件 2、绘制散点图 3、求直线方程 4、回归方程的假设检验 5、回归系数的假设检验 6、用决定系数评价回归方程 7、绘制回归直线 8、残差分析 9、回归方程的应用 表9-1 某地10名三岁儿童的体重与体表面积数据 P112【SPSS操作】以“(胰岛素)”、“(血糖)”为变量名,建立2列20行数据集li0601.sav。 (1)正态性检验:Analyze → Descriptive Statistics → explore →胰岛素、血糖入Dependent variable→ plots → Nomality plots with tests →OK (2)作散点图 :Graphs(绘图)→Legacy Dialogs→ Scatter/Dot(散点图)→Simple Scatter→Define,“血糖”→Y Axis(轴)框,“胰岛素”→X Axis(轴)框,→OK。 (3)线性回归: Analyze→Regression→Linear,“血糖→Dependent,“胰岛素”→Independent框→OK。 改用影像1-2班统计学与科研方法成绩分析: 正态性检验P=0.000(非正态)→等级相关P=0.000(相关系数rk=0.293,rs =0.405,不用r表达)→直线回归(y=40.63+0.50x ) 第五节 多重线性回归 一、多元(多重)线性回归( multiple linear regression) 1个应变量与多个自变量之间线性依存关系。 Example:SBP versus age, weight, height, etc 偏回归系数的含义:β1表示当Ⅹ2, Ⅹ3……等等不变时, Ⅹ1每变动一个单位,因变量Y的平均变动量。 二、基本条件 ① xy呈线性关系; ② x 互相独立; ③ y正态分布。 三、多重线性回归方程的建立:最小二乘法原理。 确定n:n应自变量个数m的5倍、最好20倍,否则效能不足。 n↑→结果越稳定。 标准化偏回归系数用来评价每个自变量对因变量的作用大小
文档评论(0)