线性相关和回归分析课件.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
线性相关和回归分析课件

yd,zheng 北京大学医学部公共卫生学院 统计学研究的核心问题? 变 异 VARIATION 总变异=研究因素的效应+随机误差 在一定的概率水平作出统计推断 变异性的度量: 方差 Variance 内容提要 线性相关 线性回归 线性模型的“LINE”条件 多重线性回归与相关 偏相关 线性相关 Linear Correlation 简单相关系数 简单相关系数 Pearson correlation coefficient Product-moment correlation coefficient 对相关系数公式的推敲 相关分析 两个变量的变异性度量 协方差(covariance, cov.) 变量的信息度量 单变量 σ2 双变量Σ var(x), var(y) cov(x,y) 多变量Σ variance-covariance matrix 协方差矩阵 样本的方差-协方差矩阵(variance-covariance matrix) 如果有p个观测变量 , 则样本的协方差矩阵记为 相关矩阵 如果有p个观测变量 ,其相关阵(correlation matrix)记为 相关系数的取值 典型的散点图 慎用相关的情形 慎用相关的情形 深入理解相关性 统计上的相关推断只是事物间的伴随关系。 从统计相关到专业上因果关系的确认需要更多证据。 小孩的身高和小树的高度 鞋子的大小和儿童阅读水平 受教育程度与失业(年龄为混杂) 脂肪摄入量和结肠癌 秩相关 Rank Correlation Spearman correlation 线性回归 Linear Regression 双变量的名称种种 因变量(dependent variable) 自变量(independent variable) 反应变量(response variable) 解释变量(explanatory variable) 结局变量(outcome) 研究因素(design factor) 直线回归模型 直线回归系数的最小二乘估计 基本思想:使样本点到回归直线的纵向距离的平方和最小。 定义e (residual)为残差,Q为残差平方和 直线回归系数和截距计算公式 假设检验1 方差分析:就总体而言,回归关系是否存在,或回归方程是否成立? 假设检验2 t 检验:H0 : β = 0 , H1 : β ≠ 0 区间估计1 μy|x的置信区间(confidence interval for conditional mean of Y) 给定X=x0时, 的标准误 的(1-α)置信区间为 ν=n-2 区间估计2 个体Y值的预测区间(predicted interval for individual Y) 给定X=x0时,个体Y值的的标准差估计为 个体Y值的(1-α)置信区间为 线性回归的条件 线性(linear) 独立(independent) 正态(normal) 等方差(equal variance) 中国少年儿童年龄(岁)的和平均身高(厘米) 中国6-18岁男童身高频数分布图— 变异范围大约从100cm~190cm 在一定的年龄下,身高也存在变异 残差分析 更一般化的线性模型 LINE条件并不约束自变量 t test model ANOVA model 用线性模型的观点来考虑两组或多组均数比较的问题 设为α1’ 甲组平均效应, α2’ 乙组平均效应,则 y = αi’ + ε , i=1,2 令 u= α2’ , α= α1’ – α2’ 则 y = u + α + ε 甲组 y = u + ε 乙组 规定z=0表示乙组,z=1表示甲组,则 出生体重是否存在性别差异? t检验结果 用GLM进行回归分析 z=1 当Group=1 z=0 当Group=2 分类变量进入回归模型的处理 可以估计多个回归系数 如果有k个分类,则估计出k-1个回归系数 实际的处理方式 引入哑(假)变量(dummy variable

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档