- 1、本文档共18页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
.
PAGE
.
受限因变量模型
这一章讨论响应变量仅仅被部分观测到的情况。引入被部分观测到的潜在随机变量y*,y*的实际观测变量为yi。引入二元指示变量Di,如果ai y*bi,Di= 1;否则,Di = 0。即Di表示变量y*是否可以被观测得到。(ai, bi)称为观测区间。如果对于Di = 1 和Di = 0都有实际观测数据,当Di = 1时,潜在变量与实际观测变量相等,当Di = 0时,实际观测变量同样有取值,但不等于潜在变量,这时称数据被归并(censored),即小于ai的数据被归并为ai,而大于bi的数据被归并为bi。用数学符号表示为:
。 (1)
如果只有当Di = 1时实际观测变量yi才有观测数据,即:当Di = 1时,潜在变量与实际观测变量相等,而当Di = 0时,yi没有观测值,这时称数据被截断(truncated),即小于ai的数据和大于ai的数据被截断了。因此截断数据与归并数据的区别在于,对于观测区间外的数据,归并数据将将其都归并为一点,而截断数据没有观测值。
将潜在随机变量y*的基本模型设定为:
。 (2)
其中?i为位置参数,?为刻度参数;vi为独立于xi的连续随机扰动项,均值为0,方差为1,其分布函数、密度函数分别为F、f 。在这些假定条件下,yi*的均值为?i,方差为?2,分布函数为,概率密度函数为(证明请参见附录1)。ai yi* bi等价于,那么yi*被观测到的概率为:
(3)
下面对截断数据模型和归并数据模型分别进行介绍
截断数据模型
如果样本数据是从总体的一部分抽取得到,我们把这类数据称为截断数据。比如,研究高收入阶层(月收入x ? 10000)的消费与收入的关系,所采集的数据只是位于收入总体分布的一个区间里。假设所有居民的收入服从正态分布,那么高收入阶层的收入只是在x ? 10000的区间里观测得到的。下面介绍截断数据的分布特征和模型估计。
截断数据的分布特征
如前面所述,截断数据只包括Di = 1情况下的数据。截断分布是指变量高于(低于)某个设定值的未截断部分的分布。如果变量只有在高于某一门限值a时才被观测到(x a),称之为从下面截断(truncation from below)或者是从左边截断(truncation from left);如果变量只有在低于某一门限值b时才被观测到(x b),称之为从上面截断(truncation from above)或者是从右边截断(truncation from right)。如图所示。
图一 截断分布图(上面截断(左图)、下面截断(右图))
下面分析截断数据的分布函数、密度函数、均值和方差。
截断变量的分布函数和密度函数
给定模型(1)及相应的观测概率(2),那么第i个观测变量yi的条件分布函数为(证明请参见附录2):
(4)
(注:此处及后面的的定义均与前面相同)
密度函数为:
(5)
从截断数据的密度函数(4)式我们可以推出从下面截断或从上面截断的各种不同分布的变量的密度函数。读者可以参阅下面介绍的几个例子。
截断均匀分布的密度函数和分布函数
如果x*在区间[a,b]上服从均匀分布(uniform distribution),那么
, (6)
如果在x*= c处截断,即实际观测值x= x*,如果x*? c;x= c,如果x* c。
这是左截断的例子,即右截断点=b。根据(5)式,在x = c处截断的随机变量x的截断分布的密度函数为:
(7)
分布函数为:
(8)
截断正态分布的密度函数
模型设定为:
,
yi = yi*,如果 (9)
yi = ai,如果
yi = bi,如果
其中vi ~N(0, 1)。即 yi* ~N(?i, ?2),其中?i、?分布表示yi的均值和标准差。以?、?分别表示标准正态分布密度函数和分布函数。那么:
(10)
其中,。
根据截断正态分布的密度函数公式:
可直接得到时yi的密度函数:
(11
文档评论(0)