- 1、本文档共70页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多层统计剖析模型
多层统计分析模型 陶庄 中国CDC卫生统计研究室 绪论 青蛙与池塘(“Frog-pond theory”) 青蛙—学生个体; 池塘—学校环境; 学生的成绩好坏不仅受到个体本身的影响,也受到学校环境的影响! 多层数据 低一层(低水平)单位(个体)的数据嵌套(nested)于高一层(高水平)的单位(组群)之中。 结局变量,个体解释变量,场景变量(contextual variables) 组内观察相关(within-group observation dependence) 同一组内的个体,较不同组的个体而言,在观念、行为等很多方面更为接近或相似;即便不是刻意分组,也是如此。 组内同质(within-group homogeneity),组间异质(between-group heterogeneity) 很小的相关将导致很大的I类错误。 多层数据的常见来源 复杂抽样; 多中心临床试验; 纵向研究(longitudinal studies)与重复测量(repeated measures); “高低搭配”; Meta分析; …… 多层统计模型的研究内容 哪些个体解释变量会影响结局变量; 哪些场景变量会影响结局变量; 个体解释变量对结局变量的影响是否会受到场景变量的影响。 多层统计模型出现前对多层数据进行分析的探索 探索(1)—分别估计 在个体水平和组群水平分别进行分析; 试图用单一的个体水平模型的分析结果来推论另一水平的统计结果。 探索(2)—传统回归 用传统的固定效应回归模型中一般的交互项理解多层数据中的跨层(cross-level)交互作用。 探索(3)—两步模型(two-stage model) 第一步模型,对各组分别进行同一回归模型估计,获得一系列的系数; 对这些系数的恒定性进行检验; 如果不恒定,则进行第二步模型,以组变量为因变量,系数为自变量进行回归。 探索(3)—两步模型的问题 无论哪一步均使用OLS,并不适用; 当组群过多,则十分麻烦; 某些组内样本量很少时,进行回归不稳定; 将每个组群认为是不相关的,忽略了其为从一大样本中抽取的事实。 多层统计模型的出现 研究的学者很多; 系统的主要为两; 研究的理论没有根本上的分歧; 双方研究成果的发布时间基本相同(上世纪80年代末90年代初); 分别有各自分析的成熟的软件; 目前,大家基本上接受两组人分别独立开发出同一模型的结果。 S. Raudenbush与A. Bryk 模型称为:hierarchical linear model; 软件为:HLM H. Goldstein 模型称为:multilevel models; 软件为:MLwiN(早期版本称ML3,MLn) 多层统计模型的名称 multilevel models hierarchical linear model random-effect model random coefficient model various component model mixed-effect model empirical Bayes model 多层统计模型的优点 同时分析组效应和个体效应; 不需有独立性假设; 对稀疏(sparse)数据,即每组样本很少的数据,特别有效; 特别适合对发展模型(GM)的分析。 多层统计模型的局限性(1) 模型复杂,不够简约; 需较大样本以保证稳定性; 组群数量较少,会出现偏倚; 高水平单位并非严格抽样获得; 某些场景变量通常是各组个体的聚集性测量,而不是总体内个体的聚集性测量; 多层统计模型的局限性(2) 研究对象一般具有流动性,即受到群组影响的程度不同,虽可用出入时间进行控制,但此信息一般不可知; 依然存在自变量带有测量误差的问题,必需借助于结构方程模型(SEM); 完全嵌套假设,即每一个低水平单位嵌套、且仅嵌套于一个高水平单位。 用于多层统计模型的软件 专门软件:HLM;MLwiN;SuperMIX;aML;EGRET;LISREL;Mplus等。 通用统计学软件:SAS;SPSS;stata;S-plus/R等。 线性多层统计模型 基础知识 组内相关系数(Intra-Class Correlation Coefficient, ICC) 组间方差占总方差的比例。 可使用对“空模型”的拟合获得; 值域在0到1之间,越接近1,说明相关越明显; 对ICC的检验是是否选择多层模型的依据。 两水平模型的公式表达 空模型(又称截距模型) 两个水平1自变量、一个水平2自变量 一般模型 SAS中的公式表达 模型假设 模型假设—SAS的表达 固定和随机回归系数 模型估计方法 最大似然法(ML) 包括普通最大似然法(ML)和限制性最大似然法(REML); 两者用于估计的残差基础不同,后者的残差包
您可能关注的文档
- 国际贸易主要货币.ppt
- 国际运输保险的案例.ppt
- 国际金融危险的案例12.ppt
- 国际金融风险的管理11.ppt
- 国际黄金初涉知识点.ppt
- 图书的管理system论文答辩.ppt
- 图像system专题复习.ppt
- 图书资料中级专业的技术职称任职资格申报评审条件.pptx
- 图像抓取软件简介.pptx
- 图表漫画写作剖析.ppt
- 2024年江西省寻乌县九上数学开学复习检测模拟试题【含答案】.doc
- 2024年江西省省宜春市袁州区数学九上开学学业水平测试模拟试题【含答案】.doc
- 《GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语》.pdf
- 中国国家标准 GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语.pdf
- GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- 《GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构》.pdf
- 中国国家标准 GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 中国国家标准 GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 《GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南》.pdf
最近下载
- 小学一年级家长会语文老师PPT课件1_图文.ppt
- 奥鹏云南开放大学 小学语文案例教学(20秋)形考作业4(客观).doc VIP
- 沅陵大曲酒厂续建项目(重大变更) 环境影响报告书.pdf
- SH∕T 1541.1-2019 塑料颗粒外观试验方法 第1部分:目测法.pdf
- 泳池清洁机器人.pdf VIP
- 中职高考语文二轮复习写作技巧专项突破专题01 应用文写作-技巧与练习(含详解).docx VIP
- (人教版)数学三年级上册计算题“天天练”习题卡,含100份题组,附参考答案.doc
- 【新教材】人教PEP版(2024)三年级上册英语Unit 1 Making friends单元整体教学设计.docx
- 乡村学校德育工作实践.docx VIP
- “国家中小学智慧教育平台”培训方案(2).doc
文档评论(0)