多层线性模型概述1精要.ppt

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多层线性模型概述1精要

HLM 数据特点 对于嵌套数据,传统回归模型的做法: (1)个体(如学生)水平上分析 问题:同一班级的学生间相互独立的假设是不合理的,同样对不同班级的学生和相同班级的学生作同一假设也是不合理的。 (2)组(如学校)水平上分析 问题:丢失了班级内学生个体间的差异的信息。 HLM 数据特点 对于嵌套数据,传统回归分析的假设往往无法满足。 传统的线性回归模型假设变量间存在直线 关系,因变量总体上服从正态分布,方差齐性,个体间相互独立。前两个假设较易保证,但方差齐性,尤其是个体间相互独立的假设却很难满足。 独立性不满足带来问题 传统回归系数估计的标准误依赖于相互独立的假设; 如果独立性的假设不满足,得到的标准误的估计往往偏小,因此所犯第一类错误的概率往往偏大。 多层线性模型简介 多层线性模型--一种处理嵌套数据的统计方法。通过定义不同水平(层)的模型,将随机变异分解为两个部分,其一是第一水平个体间差异带来的误差,另一个是第二水平班级的差异带来的误差。可以假设第一水平个体间的测量误差相互独立,第二水平班级带来的误差在不同班级之间相互独立。多水平分析法同时考虑到不同水平的变异 。 HLM数学模型 例如:对 73 个学校 1905 名学生进行调查,目的是考虑其刚上高中时的入学成绩与三年后高考成绩之间的关系。 考虑方法: (1)如果用传统的线性回归分析,直接在学生水平上进行分析,得出入学学业成绩对高考成绩之间的一条回归直线,如下图1 所示,从图1的结果可以看出,传统回归分析没有区分不同的学校之间的差异。 图1:不考虑学校之间差异的回归直线 HLM数学模型 (2)如果将数据进行简单合并,用每个学校学生的平均成绩代替这个学校的成绩,直接在学校水平上估计入学成绩对高考成绩的影响,得到一条回归直线,如图2 所示,这种方法忽略了不同学生之间的差异; 图2 :只考虑学校差异忽略学生差异回归直线 HLM数学模型 (3)如果假设不同学校入学成绩对高考成绩的回归直线截距不同,斜率相同(平均学习成绩之间存在差异),得到如图3的结果,从图中结果可以看出,不同学校学生平均高考成绩之间存在差异。 图3 :考虑不同学校平均成绩差异 的回归直线 HLM数学模型 (4)对73所学校分别做回归分析,得到如图4的结果,如图4所示,从图中结果可以看出,不同学校回归直线的截距和斜率均不同,即:不同学校学生平均高考成绩之间存在差异,入学学业成绩对高考成绩的影响强度不同。 图4 :考虑不同学校平均成绩差异和入学对毕业成绩影响程度差异的回归直线 注意: 目前只能处理高水平变量如何影响低水平变量,而不能处理低水平如何影响高水平。 谢 谢 多层线性模型概述 为什么要量化? 人类进入近代文明之前,对现实世界的认识和描述大多是定性的。如“日月星辰绕地球旋转” ,现在的科学则要定量地知道,一个物体以什么样的速度沿什么样的轨道运行,怎样可以准确无误地把人送到月球上的指定的地点。反复验证、精确预测。 建立模型、抽象化、最优化、逻辑分析、由数据进行推断、符号运算等—强有力的思维方式 主要内容—主要招数 为什么要用多层线性模型? 什么是多层线性模型? 两水平模型应用举例 为什么要用多层线性模型 回归分析模型的回顾 方差分析(ANOVA)或回归分析,只能对涉及一层数据的问题进行分析,而不能对涉及两层及多层数据的问题进行综合分析。 作相关、回归分析等 y=b0+ b1x1+ b2x2+…+bpxp+r 截据的意义? 斜率的意义? 回归分析模型 截距,或者说是当X等于0是的Y值; 线性回归系数,即随X的单位变化而引起的Y的变化; 残差; 回归分析模型的假设 线性(Linearity) 误差或观测个体之间相互独(independent) 误差方差齐性(homoskedastic) 误差正态分布( normally distributed) 假设的弊端 意味着Y是从某个总体中随机取样的。 思考:在对Y进行取样时,如果个体是属于自然存在的第二层单位,如,学生是镶嵌于班级或者学校,并且某些班级或者学校的变量被认为会对Y产生影响。 其相关反映了两个方面的因素 个体水平的相关 组间的协变异(X组间收到变异受到Y组间变异的影响程度) 结果 残差不能满足上述假设; X与Y的实际相关程度可能会被夸大; 举例 以下研究该如何进行分析? 目的是想了解亲社会、退缩、攻击与同伴关系之间的关系是怎么样的? 本研究收集到了有关儿童亲社会、退缩、攻击以及同伴关系的数据。 因变量:同伴关系 自变量:亲社会、退缩、攻击 分析结果 分析结果显示:1儿童的退缩行为和同伴接受之间负向

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档