网站大量收购独家精品文档,联系QQ:2885784924

社会统计学:第13章 回归与相关.ppt

  1. 1、本文档共76页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

★在多数情况下,多个变量的关系又可以分解为若干个二变量之间的关系,即多变量之间的关系可以通过若干二变量间的关系来描述。★虽然在自然界和社会生活中,曲线相关现象远比直线相关多,但由于数学手段的局限,社会研究中多以阐述线性相关为主。文化程度平等就业机会女性就业女性社会地位13.2.1一元线性回归一元线性回归方程涉及一个自变量(也叫解释变量或协变量)。因变量(也叫响应变量)y与自变量x之间为线性关系。被预测或被解释的变量称为因变量(dependentvariable),用y表示。用来预测或用来解释因变量的变量称为自变量(independentvariable),用x表示。因变量与自变量之间的关系用一个线性方程来表示。???????????1、自变量取某一值时,因变量对应于一概率分布,又称条件分布。如果对于所有的x,条件分布都相同,说明x与y是没有关系的,反之x与y是有关系。2、分布的比较是复杂的,因此简化为在x不同取值下,y数字特征的比较。其中最简单的就是均值的比较。一元线性回归方程

(regressionequation)描述y的平均值如何依赖于x的方程称为回归方程。一元线性回归方程的形式如下E(y)=+?x方程的图示是一条直线,也称为直线回归方程。是回归直线在y轴上的截距,称为回归常数。?是直线的斜率,称为回归系数,表示当x每变动一个单位时,y的平均变动值。误差项e是随机变量:e反映了除x和y之间的线性关系之外的随机因素对y的影,是不能由x和y之间的线性关系所解释的变异性。??????????估计的回归方程

(estimatedregressionequation)一元线性回归中估计的回归方程为用样本统计量和代替回归方程中的未知参数和,就得到了估计的回归方程总体回归参数和是未知的,必须利用样本数据去估计其中:是估计的回归直线在y轴上的截距,是直线的斜率,它表示对于一个给定的x的值,是y的估计值,也表示x每变动一个单位时,y的平均变动值a,b的值如何确定?13.2.2回归直线方程的建立与最小二乘法最小二乘法☆1801年1月,意大利天文学家皮亚齐发现了第一颗小行星谷神星。☆经过40天的跟踪观测后,由于谷神星运行至太阳背后,使得皮亚齐失去了谷神星的位置。随后全世界的科学家利用皮亚齐的观测数据开始寻找谷神星,都没有结果。谷神星☆1801年9月,当时24岁的高斯也计算了谷神星的轨道,这帮助奥地利天文学家奥尔伯斯根据高斯计算出来的轨道重新发现了谷神星。☆高斯使用的最小二乘法的方法发表于1809年他的著作《天体运动论》中。使因变量的观察值与估计值之间的离差平方和达到最小来求得a和b的方法。即用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小。最小二乘估计

(图示)xy(xn,yn)(x1,y1)?????????(x2,y2)(xi,yi)}ei=yi-yi^最小二乘法

(a和b的计算公式)?根据最小二乘法的要求,可得求解a和b的公式如下例见page345【例1】13.2.3回归直线的拟合优度拟合优度:指回归直线对观测值的拟合程度。若观测点离回归直线近,则拟合程度好;反之则拟合程度差。变差因变量y的取值是不同的,y取值的这种波动称为变差。变差来源于两个方面由于自变量x的取值不同造成的。除x以外的其他因素(如x对y的非线性影响、测量误差等)的影响。变差的分解

(图示)xyy{}}?TSSRSSRSSRE1E2E1-E2离差平方和的分解

(三个平方和的关系)TSS=RSS+RSSR总平方和(TSS){回归平方和(RSSR)剩余平方和(RSS){{离差平方和的分解

(三个平方和的意义)总平方和(TSS)反映不知道x与y有关系,估计y的总误差E1剩余平方和(RSS)反映知道x与y有关系,估计y的总误差E2,是通过回归直线进行估计的误差,3.回归平方和(RSSR)反映通过回归直线被解释掉的误差,也称为可解释的平方和判定系数r2

(coefficientofdetermination)回归平方和占总离差平方和的比例

您可能关注的文档

文档评论(0)

胖鸥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档