对数线性模型.ppt

下载文档 降价啦

11
0
约5.27千字
约 43页
2017-06-18 发布于湖北
举报
版权申诉
保障服务

对数线性模型.ppt

1、本文档共43页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

对数线性模型概要

通过上组式子，我们可以计算出线性模型等式右侧的所有参数值。 A因素效应是行平均值与总平均值之差 B因素效应是列平均值与总平均值之差交互效应计算结果表示在除去所有其他分布效应之后两个因素之间的净关联。常数项只受样本规模和交互单元数的影响；主效应项反映的是各因素内部类别频数分布的特征，是在总平均频数基础上的“补差”；如果模型中所有交互效应都等于0，我们将会看到虽然每行（列）频数不同，但行（列）频数分布比例却是相同的，都等于原来分类变量的类别分布比例。泊松分布多项分布乘积-多项分布所以我们不能直接应用最小二乘法对模型、总体、参数进行估计，但幸运的是，三个抽样模型下的极大似然估计是等同的。但是可以通过迭代再加权最小二乘法，可是运算起来比较繁琐。 4、分布 5、估计参数估计通俗的来讲：根据抽样结果来合理地、科学的猜测一下总体的参数大概是什么？或者是在什么范围？点估计就是用样本计算出来的一个参数来估计未知参数；区间估计就是通过样本计算出来一个范围来对位置参数进行估计。极大似然法与最小二乘法的区别于联系最小二乘法所要解决的问题是：为了选出似的模型输出与系统输出尽可能接近的参数估计，用误差平方和即离差平方和的大小来表示接近程度。使离差平方和最小的参数值即为估计值。简单来说，已知点，自己拟合模型也即分布函数（概率密度函数的积分），进行预测。极大似然估计所要解决的问题是：选择参数?，使已知数据在某种意义下最可能出现。某种意义指的是似然函数最大，此处似然函数就是概率密度函数。也就是经常提到的“模型已知，参数未定”。二者的区别就是，后者需要知道概率密度函数。最小二乘法要的是求出最优的那个参数，而极大似然要求出概率最大（最可能出现的）参数。举个例子，生活中我们一个着眼最合理是哪一个，一个着眼于最可能的是哪一个（极大似然法）当总体服从正态分布时，二者是一样的。对于最小二乘法，当从模型总体随机抽取n组样本观测值后，最合理的参数估计量应该使得模型能最好地拟合样本数据；而对于最大似然法，当从模型总体随机抽取n组样本观测值后，最合理的参数估计量应该是使得从模型中抽取该n组样本观测值的概率最大。密度函数和似然函数（带着参数的密度函数）是相同的，但前者视参数是固定的且数据时变化的，后者视参数变化的且数据时固定的。（1）写出似然函数；（2）对似然函数取对数，并整理；（3）求导数；（4）解似然方程三、对数线性模型的假设检验 1、假设检验的作用统计推论中包括参数估计与假设检验两部分，上面我们已经介绍了参数估计，那估计的可信度有多少，还要经过假设检验。不经过统计检验，研究者便不能肯定得到的参数估计是不是仅仅源于抽样误差，因而不能肯定在总体中是否存在相同情况。所有结论只能限于这个样本之内，不能肯定再抽一个样本能否得到类似结果。 2、统计量似然卡方比，根据相关计算，看原假设是否成立。贝叶斯信息标准，不同模型而言越小的BIC越好。四种主要检验： 1、对于假设模型的整体检验； 2、分层效应的检验； 3、单项效应的检验； 4、单个参数估计的检验。 1、对于假设模型的整体检验采用似然比卡方检验（likelihood-ratio chi-square test，标为L2）在样本量较大时， L2与皮尔逊卡方统计量的值十分接近。 L2优越性： 1、期望频数采用似然估计方法，因而更加稳健； 2、可以被分解成若干部分，即各项效应都有对应的似然卡方值，并且它们的似然卡方值之和等于整个模型的似然卡方比值。公式：其中为估计交互频数。原假设：检验模型的频数估计与观测频数无差异，也可以理解为检验模型和饱和模型无差异。（无关假设）饱和对数线性模型可以完美无缺的再现观测频数，因此不需要对饱和模型进行整体性检验。 DF等于0，意味着所检验的模型与饱和模型之间的效应项目没有差别。真正有意义的是检验非饱和模型（简略模型，reduced model）如果简略模型仍然可以比较准确的拟合观测数据（其拟合程度与饱和模型无显著差异），说明剔除的效应对于拟合意义不大。（科学的简约性原则）研究目的：不是为了再现观测频数，而是通过在模型中加入和减少交互效应项的试验，以寻求真正重要的因素。从饱和模型开始逐步剔除不重要的交互效应项，在保证拟合程度不受较大影响的前提下，直到形成效应项最少的模型。（找到最关键因素）举例说明：由图可知，自由度变为1，L2由0增大到10.284，显著性水平α为0.01（P）（拒绝原假设），说明简略模型和饱和模型存在十分显著的差异，即拟合程度受到很大影响。显著=不能剔除该交互因素在因素很多的复杂饱和模型中，通过此方法删减多个不显著效应项来形成简