网站大量收购闲置独家精品文档,联系QQ:2885784924

第51章相关与回归分析.pptxVIP

  1. 1、本文档共133页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第7章 相关与回归分析5.1相关分析 5.2 一元线性回归5.1 相关分析1 变量间的关系2 相关关系的描述与测度3 相关系数的显著性检验变量间的关系y?????????x函数关系是一一对应的确定关系设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量各观测点落在一条线上 y?????????x相关关系(correlation)变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量 x 取某个值时,变量 y 的取值可能有几个各观测点分布在直线周围 相关关系 (几个例子)父亲身高y与子女身高x之间的关系收入水平y与受教育程度x之间的关系粮食单位面积产量y与施肥量x1 、降雨量x2 、温度x3之间的关系商品的消费量y与居民收入x之间的关系商品销售额y与广告费支出x之间的关系相关关系(类型)相關係數的強度與正負號的方向13-相关关系的描述与测度相关分析及其假定相关分析要解决的问题变量之间是否存在关系?如果存在关系,它们之间是什么样的关系?变量之间的关系强度如何?样本所反映的变量之间的关系能否代表总体变量之间的关系?为解决这些问题,在进行相关分析时,对总体有以下两个主要假定两个变量之间是线性关系两个变量都是随机变量??????????????????????????????完全正线性相关完全负线性相关非线性相关????????????????????????????正线性相关不相关负线性相关散点图(scatter diagram)相关关系的描述与测度(相关系数)相關係數的計算13-对于坐标为(xi, yi)的任一点p,它与( )的离差为: ,由图可以看出:第一象限中所有的点:第二象限中所有的点:第三象限中所有的点:第四象限中所有的点:因此可以用 来对xi和yi之间的关系进行一种度量。从实际情况看, 的数值可能会随着观察值对数的增加而无限地增大,也要受到x和y的度量单位及变异程度的影响。可以用单位标准差来表示两个这些离差并进行平均。相关系数(correlation coefficient)度量变量之间关系强度的一个统计量对两个变量之间线性相关强度的度量称为简单相关系数若相关系数是根据总体全部数据计算的,称为总体相关系数,记为?若是根据样本数据计算的,则称为样本相关系数,简称为相关系数,记为 r也称为线性相关系数(linear correlation coefficient) 或称为Pearson相关系数 (Pearson’s correlation coefficient) 积差相关积差相关是英国统计学家皮尔逊(Pearson)于20世纪初提出的一种计算相关的方法,因而被称为皮尔逊积差相关,也称为积矩相关(product moment correlation)。Pearson相关是非常基本且常用的一种分析两个连续变量之间相关关系的方法。积差相关适用条件连续变量:根据得到数据的方式判断,测量数据。正态分布:正常人群的身高、体重、智力水平、成绩线性关系:根据相关散布图可判断两个变量之间是否线性关系。样本:成对数据,样本容量大于等于30每对数据之间相互独立 ●总体相关系数 对于所研究的总体,表示两个相互联系变量相关程度 的总体相关系数为: 总体相关系数反映总体两个变量X和Y的线性相关程度。 特点:对于特定的总体来说,X和Y的数值是既定的 总体相关系数是客观存在的特定数值。 期望值分别为E(X) = μ 与 E(Y) = ν 的两个实数随机变量X与Y之间的协方差定义为:COV(X,Y)=E[(X-E(X))(Y-E(Y))] 相关系数 (计算公式)? 样本相关系数的计算公式或化简为相关系数的性质性质1:相关系数的取值在-1与1之间。当r=0时,表明X与Y没有线性相关关系。当 时,表明X与Y存在一定的线性相关关系: 若 表明X与Y 为正相关; 若 表明X与Y 为负相关。当 时,表明X与Y完全线性相关: 若r=1,称X与Y完全正相关; 若r=-1,称X与Y完全负相关。相关系数的性质性质2:r具有对称性。即x与y之间的相关系数和y与x之间 的相关系数相等,即rxy= ryx性质3:r数值大小与x和y原点及尺度无关,即改变x和y的 数据原点及计量尺度,并不改变r数值大小性质4:仅仅是x与y之间线性关系的一个度量,它不能用 于描述非线性关系。这意

文档评论(0)

136****1820 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档