- 1、本文档共20页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
zhou:lecturediscreteeventhistoryforscreen
第二讲 离散时间的事件史分析模型
提要
离散时间事件史统计模型的概念
资料结构
统计分析
统计结果的解释
其他推广
阅读材料
Paul Allison: Sociological Methodology 1982
1.离散时间事件史模式的概念
基本特点
事件是离散型的:是/否,存在/不存在
时间是离散型的:
风险率在一个时间区间内是常量:每年第四季度的职务提升;
风险率可能随时变化,但是我们只能在一个固定的时间点上测量:一年的平均收入
风险率可能随时变化,但是解释变量的更新只是在一个固定时间点上测量;
为什么使用“离散时间”的事件史统计模型?
参数模型的困难:
删截的资料处理;
随时间变化的变量的资料处理;
许多资料信息的更新都是在离散性时间区间的:每年、每季度,等等。使用离散性时间的模型不会浪费信息。
离散性时间模型的优点:
容易处理删截情况
容易更新随时间变化的变量
容易处理资料结构
容易解释统计结果
统计模型:Logistic 模型
(0)起点:一个基本的统计模型: h(t) = (’x
(1)定义离散时间的风险率:
Pit = Pr[Ti = t | Ti ( t, xit]
上式的表述与风险率函数有类似之处,即我们关心的是在某一风险集 (Ti ( t)中,事件(Ti = t)发生的概率。
(2)下一步,建立风险率与时间和解释变量之间的关系。最为常用的统计模式是the logistic regression function
0
Logistic 模型:
binary outcome (0/1)
interested in probability
复习:关于概率的模型化 ( odds, log-odds.
odds
log-odds
probability
在这里, t = 1, 2, 3,… 即事件(y=1)和自变量(xit)都是离散时间性的。这个模型在事件通常在一个离散时间段里(非连续性时间)发生的情形下最为适用。
Logistic模型与事件史分析方法之间关系
引入随时间变化的变量
建立person-year 资料记录
在一定的时间点(或时间段:年)更新信息 :工作单位、年龄
考虑使用(t-1)点上的因变量
考虑风险集
确定风险集的成员—入党事件:
解释统计结果
2.资料结构: 入党事件
资料结构
人-年(季度,天,小时)资料记录栏(person-year record)
在这里,“年”(或季度、天、小时)是离散性时间区间的单位
应该考虑的事项
假设:可以看做是一个“年度”事件—某一年xxx入党了;
我们关心的解释变量(如果随时间变化)是按年度测量的;
工作单位
教育水平
如何将随时间变化的变量结合进资料结构:增加记录;
风险集:十八岁以后
解释变量应该使用(t-1)时间;
如何处理删截的情况:一旦删截,退出风险集,停止记录;
一旦经历了事件,退出风险集,停止记录;
例子:sample600_eha 资料结构
3.模型估测
logistic模型使用最大似然值法估测参数:
δi – “event”= 1;“no event”= 0。如果一个样本经历了事件,那么它对似然估算的贡献是T的密度函数;如果没有经历事件,或 ti 被删截,那么它的贡献是1-累积分布函数。这个最大似然值法公式与我们以前讨论的风险率估测的最大似然值法的道理是一样的。
4.统计结果的解释
以下我们用“入党”作为一个“生活历程”的重要事件为例来说明上面讨论的这些课题。统计分析的结果见附录的表1。
统计结果的讨论一般包括以下内容
统计模型的检验:model significance,nested models,model specification
实证假设的检验:test of hypotheses
统计结果的表述:统计显著性,作用的方向,作用的大小
统计结果的解释
模型的检验—与logistic模型一样
likelihood ratio test:
-2log-likelihood statistics: restricted vs. Unrestricted
(2 distribution, df: the number of restricted variables
what is the baseline?
参数:log-odds ( log(rate)
odds ( rate
风险率
文档评论(0)