统计分析软件基础教程2010-06相关与回归分课件.ppt

统计分析软件基础教程2010-06相关与回归分课件.ppt

  1. 1、本文档共190页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计分析软件基础教程2010-06相关与回归分课件.ppt

相关分析 线性相关是描述变量间联系中最简单和最常用的一种。线性相关系数是描述两个变量间线性联系程度的统计指标; 积差线性相关系数的计算公式: 相关分析的CORR过程 散点图是直观地观察连续变化变量间相依关 系的重要工具。利用编程可绘制两个变量的散 点图。 强相关并不表示一定存在因果关系; 练习题 对数据集(DST.BCLASS),用SAS菜单系统及编程完成以下练习: (1) 计算AGE,WEIGHT,HEIGHT的相关系数和偏相关系数。 (2) 绘制AGE,WEIGHT,HEIGHT的散布图阵,并对预测均值附加85%的置信椭园. (3) 用SAS/INSIGHT绘制WEIGHT与HEIGHT的散布图(男女用不同颜色,不同年龄用不同的符号表示). 一元线性回归分析 建立回归方程: 确定变量:Y 与变量x1, x2,. . , xi有相关关系 . 选择形式:Y 与 x1, x2,. . , xi 以什麽形式相联系, 确定回归参数数. 预测值与置信限 广义线性模型(GENMOD)简介 一元线性回归的REG过程 proc reg data=dst.fitness ; model oxygen = runtime ; run; proc reg data=dst.fitness ; model oxygen = runtime / p cli clm ; id runtime; output out=outfit p=poxy r=roxy l95=l95oxy u95=u95oxy; run; 回归线作图--REG中的PLOT语句 回归线作图--用GPLOT过程 symbol1 value=star ci=blue cv=red i=rlclm95 width=2; proc gplot data=dreg1; plot y*x; title2 ‘Y对x的回归线及均值的95%置信限; run; (REG24.sas或Reg24B.sas) 练习题 1. 讨论某种合成纤维的强度Y与拉伸倍数x的相关关系(数据见数据集DST.regE21).试用SAS菜单系统及编程完成以下练习: (1) 建立Y(合成纤维的强度)与x(拉伸倍数)回归关系式,并给出回归系数的检验结果. (2) 给出当x=2.2,3.2,6.2和10.2时,合成纤维的强度的预测值及线性回归预测均值的90%置信区间. (3) 绘制Y对x的散点图,回归线及均值的95%的置信限. 2.对不同类型汽车的价格和性能的数据(DST.CARS) 用SAS菜单系统及编程完成以下练习: (1) 建立MIDPRICE(中间价)与PERFORM(使用效率--性能)回归关系式,并给出回归系数的检验结果. (2) 给出当PERFORM=0.03,0.04,0.05和0.06时,中间价的预测值及线性回归预测均值的90%置信区间. (3) 绘制MIDPRICE(中间价)对PERFORM(性能)的散点图,回归线及均值的95%的置信限. 多元线性回归分析 多元线性回归模型可同时研究 Y 与多个自变量 (独立变量) x1, x2,. . , xp 间的关系; 对多元回归模型进行解释和选择最优要比单变 量的模型复杂; 多元线性回归分析对于解释分析因变量与自变 量的关系、预测因变量等方面是一个有用的工具。 一些变量间的非线性关系也可归为多元线性回 归模型(例如多项式关系). 多元线性回归模型: Yi=b0+b1xi1+. . .+bpxip+ei, i=1,. . .,n 在多元线性回归分析中输出的回归系数(参数)的 t 检验里,都是假定其它自变量进入回归的前提下检 验该变量进入的显著性.即构造t统计量的平方和为偏 回归平方和,在后面的介绍中称之为II型平方和(SS2). 若模型中有两个变量相关性强,在这一检验中两 者的显著性都有可能被隐蔽起来.所以,这一检验结果 必须小心分析。 删除变量时,必须逐个删除.并在删除每个变量 后,注意观测其它变量的p-值的变化. 练习题 变量选择 最优选择的标准 最优选择的标准 在回归方程中,若遗漏了应加入

文档评论(0)

开心农场 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档