结构方程模型案例.docVIP

下载本文档

37
0
约1.2万字
约 19页
2017-02-13 发布于重庆
举报
版权申诉

结构方程模型案例.doc

1、本文档共19页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

结构方程模型案例

结构方程模型（Structural Equation ModelingSEM) 20世纪——主流统计方法技术：因素分析回归分析 20世纪70年代：结构方程模型时代正式来临结构方程模型是一门基于统计分析技术的研究方法学，它主要用于解决社会科学研究中的多变量问题，用来处理复杂的多变量研究数据的探究与分析。在社会科学及经济、市场、管理等研究领域，有时需处理多个原因、多个结果的关系，或者会碰到不可直接观测的变量（即潜变量），这些都是传统的统计方法不能很好解决的问题。结构方程模型是利用联立方程组求解，它没有很严格的假定限制条件，同时允许自变量和因变量存在测量误差。在许多科学领域的研究中，有些变量并不能直接测量。实际上，这些变量基本上是人们为了理解和研究某类目的而建立的假设概念，对于它们并不存在直接测量的操作方法。人们可以找到一些可观察的变量作为这些潜在变量的“标识”，然而这些潜在变量的观察标识总是包含了大量的测量误差。在统计分析中，即使是对那些可以测量的变量，也总是不断受到测量误差问题的侵扰。自变量测量误差的发生会导致常规回归模型参数估计产生偏差。虽然传统的因子分析允许对潜在变量设立多元标识，也可处理测量误差，但是，它不能分析因子之间的关系。只有结构方程模型即能够使研究人员在分析中处理测量误差，又可分析潜在变量之间的结构关系。简单而言，与传统的回归分析不同，结构方程分析能同时处理多个因变量，并可比较及评价不同的理论模型。与传统的探索性因子分析不同，在结构方程模型中，我们可以提出一个特定的因子结构，并检验它是否吻合数据。通过结构方程多组分析，我们可以了解不同组别内各变量的关系是否保持不变，各因子的均值是否有显著差异。” 目前，已经有多种软件可以处理SEM，包括：LISREL，AMOS, EQS, Mplus. 测量方程 y＝Λyη+εy??, x＝Λxξ+εx=(1）结构方程? η＝Bη+Гξ+ζ 或（I-Β）η＝Гξ+ζ （2）其中，η和ξ分别是内生LV和外生LV，y和x分别是和的MV，Λx和Λy是载荷矩阵，Β和Г是路径系数矩阵，ε和ζ是残差。三种分析方法对比线性相关分析线性相关分析指出两个随机变量之间的统计联系。两个变量地位平等，没有因变量和自变量之分。因此相关系数不能反映单指标与总体之间的因果关系。线性回归分析线性回归是比线性相关更复杂的方法，它在模型中定义了因变量和自变量。但它只能提供变量间的直接效应而不能显示可能存在的间接效应。而且会因为共线性的原因，导致出现单项指标与总体出现负相关等无法解释的数据分析结果。结构方程模型分析结构方程模型是一种建立、估计和检验因果关系模型的方法。模型中既包含有可观测的显在变量，也可能包含无法直接观测的潜在变量。结构方程模型可以替代多重回归、通径分析、因子分析、协方差分析等方法，清晰分析单项指标对总体的作用和单项指标间的相互关系。结构方程模型假设条件合理的样本量（James Stevens的Applied Multivariate Statistics for the Social Sciences一书中说平均一个自变量大约需要15个case；Bentler and Chou (1987)说平均一个估计参数需要5个case就差不多了，但前提是数据质量非常好；这两种说法基本上是等价的；而Loehlin (1992)在进行蒙特卡罗模拟之后发现对于包含2~4个因子的模型，至少需要100个case，当然200更好；小样本量容易导致模型计算时收敛的失败进而影响到参数估计；特别要注意的是当数据质量不好比如不服从正态分布或者受到污染时，更需要大的样本量）连续的正态内生变量（注意一种表面不连续的特例：underlying continuous；对于内生变量的分布，理想情况是联合多元正态分布即JMVN）模型识别（识别方程）（比较有多少可用的输入和有多少需估计的参数；模型不可识别会带来参数估计的失败）完整的数据或者对不完整数据的适当处理（对于缺失值的处理，一般的统计软件给出的删除方式选项是pairwise和listwise，然而这又是一对普遍矛盾：pairwise式的删除虽然估计到尽量减少数据的损失，但会导致协方差阵或者相关系数阵的阶数n参差不齐从而为模型拟合带来巨大困难，甚至导致无法得出参数估计；listwise不会有pairwise的问题，因为凡是遇到case中有缺失值那么该case直接被全部删除，但是又带来了数据信息量利用不足的问题——全杀了吧，难免有冤枉的；不杀吧，又难免影响整体局势）模型的说明和因果关系的理论基础（实际上就是假设检验的逻辑——你只能说你的模型不能拒绝，而不能下定论说你的模型可以被接受） 2检验、拟合优度指数