- 1、本文档共55页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
经济计量方法导论第六讲;限值因变量(limited dependent variable, LDV):即取值范围明显受到限制得因变量
例:因变量值取1/0(就是否购买)
例:因变量为非负数(出险理赔次数)等
二值因变量得回归建模
线性概率模型、对数单位模型、概率单位模型
不完整观测样本与非随机样本得回归建模
断尾正态回归模型、截取正态回归模型、托宾模型
泊松回归模型;二值因变量回归建模;二值因变量:因变量只取0/1两个值
二值响应模型(binary response models):用于二值因变量得回归建模,目标:研究响应概率
给定自变量x条件下,因变量y取1得概率
二值响应模型主要包括
线性概率模型
对数单位模型
概率单位模型;线性概率模型(linear probability model,LPM)(7、5节)
就是一种最简单得二值响应模型
源于一般线回归模型
模型形式为:
系数得含义:?j度量了因xj得变化导致y成功(取1)概率得平均变化:;线性概率模型示例:分析影响妇女外出工作得因素(MROZ、WFL)
就是否工作,其她收入来源,受教育程度,工作经历,年龄,年龄小于6岁得子女数,年龄在6-18岁之间得子女数;线性概率模型得问题:
无法保证模型给出得概率值限制在0-1范围内
前例中,当:
解决方法:预测值小于0、5得取0,大于等于0、5得取1;线性概率模型得问题:
线性概率模型反映了概率与自变量取值之间得线性相关,无法反映非线性关系
例:家庭收入与购买商品房得概率
违背了高斯-马尔科夫假定,当y为二值变量时:
表明:除非概率与任何一个x都不相关,否则一定存在异方差;复杂得二值响应模型
目得:克服线性概率模型得局限性
策略:
G(z)得函数值限制在0-1之间,一般为累积分布函数(cumulative distribution function,CDF)
种类:
对数单位模型与概率单位模型
差异:主要体现在G函数得具体形式上
问题:G函数具体形式得选择?;大家学习辛苦了,还就是要坚持;选择G函数具体形式策略得出发点
以满足经典线性模型假设得潜变量模型为基础
潜变量:其值无法观测到得变量(这里为y*,如购买带来得效应)
显变量:其值能被观测到得变量(这里为y,取1或0)
y*大于0时,y=1; y*小于等于0时,y=0
于就是:G得具体形式取决于e得分布
;若e就是逻辑斯蒂随机变量,选用Logit模型
概率密度函数(PDF)g为:
G就是逻辑斯蒂函数,为标准逻辑斯蒂随机变量得累积分布函数(CDF):
;若e服从正态分布,选用Probit模型
G就是标准正态得累积分布函数
;极大似然估计(Maximum likelihood estimation,MLE):在所有可能得?值中选择使样本有最大似然性得?
基本思路:
在给定Xi下yi得概率合写为:
似然函数与联合概率密度函数形式相同:
对数似然函数:;Logit模型具体为:
Probit模型具体为:;解释变量得偏效应;解释变量得偏效应;为方便量化x得偏效应,计算两种偏效应:
第一:平均个人偏效应(partial effect at the average, PEA)
将x以均值代入,计算比例因子:
乘以βj得到xj得平均个人偏效应
不足:有时x得均值就是没有意义得
第二:平均偏效应(average partial effect, APE),常用
以概率密度均值作为比例因子:
乘以βj得到xj得平均偏效应
比例因子与概率密度函数有关
Logit模型为:
Probit模型为:
;理论上,Logit与Probit得选择取决于潜变量模型误差项分布得假设
Logit与Probit偏效应得精确对比:
不仅瞧βj,还需乘以各自得比例因子
Logit与Probit偏效应得粗略对比:
对数单位模型中:
概率单位模型中:
若两模型给出大致相同得偏效应估计,则两βj得关系:
;;概率与自变量呈非线性;β得实际意义仍不明显;;通常得预测依据:概率阈值
评价指标1:通过混淆矩阵判断阈值就是否恰当
;评价指标1:通过正确预测百分比判断阈值就是否恰当
例:分析影响妇女外出工作得因素(MROZ、WFL);评价指标2:麦克法登(McFadden)得伪R2(pseudo R-squared),
;McFadden伪R2示例:分析影响妇女外出工作得因素(MROZ、WFL);非随机样本不完整观测样本得回归建模;非随机样本:采用非概率抽样方式获得得样本(9、5节)
外生样本选择(exendogenous sample selection):以自变量为依据,根据自变量取值范围有针对性地进行样本选择
例:研究年龄职业等因素对年收入(因变量)影响时,重点考察中年人群,即中年人群入样
基于外生
您可能关注的文档
- 结直肠癌肺转移.pptx
- 结直肠癌分期与大体分型.pptx
- 结直肠与肛门少见肿瘤与瘤样病变.pptx
- 经典层次分析法分析及实例教程.pptx
- 经典建筑分析玛利亚别墅.pptx
- 经典小说开头与怎么设置悬念.pptx
- 经济法主体制度.pptx
- 经济活动分析报告.pptx
- 经济全球化课件.pptx
- 经济全球化与对外开放.pptx
- 2024年中国钽材市场调查研究报告.docx
- 2024年中国不锈钢清洗车市场调查研究报告.docx
- 2024年中国分类垃圾箱市场调查研究报告.docx
- 2024年中国水气电磁阀市场调查研究报告.docx
- 2024年中国绿藻片市场调查研究报告.docx
- 2010-2023历年初中毕业升学考试(青海西宁卷)数学(带解析).docx
- 2010-2023历年福建厦门高一下学期质量检测地理卷.docx
- 2010-2023历年初中数学单元提优测试卷公式法(带解析).docx
- 2010-2023历年初中毕业升学考试(山东德州卷)化学(带解析).docx
- 2010-2023历年初中毕业升学考试(四川省泸州卷)化学(带解析).docx
文档评论(0)