- 1、本文档共38页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
倾向值匹配讲述
倾向值匹配研究(Propensity Matched Study);对于个体i,其未来收入yi可能有两种状态,取决于是否参加此项目,即:;处理效应:
在经济学中,我们常常希望评估某项目或政策实施后的效应,如政策推出的各种项目,此类研究被称之为项目效应评估,也被称之为处理效应,项目参与者的全体构成控制组或对照组,而未参加项目者则构成控制组或对照组。
即y1i-y0i;平均处理效应(ATE) ≡ E( y1i-y0i ):
表示从总体中随机抽取某个体的期望处理效应,无论该个体是否参与项目;依可测变量选择:
如果个体i对Di的选择完全取决于可观测的xi;匹配估计量的基本思路:
找到属于控制组的某个体j使得其与属于处理组的个体i的可测变量取值尽可能相似,即xi ≈xj;倾向值是在 1983 年由学者 Rubin 和 Rosenbaum 首次给出了明确的定义:指在一系列可观察到的协变量条件下,任意一个研究对象被分配到试验组或者对照组的概率。;马氏距离:
考虑xi与xj之间的相似度或距离(均为k维向量)
;理论依据:
如果可忽略性假定成立,则只需给定p(x)的情况下,( y0i,y1i)独立于Di
;倾向值匹配(Propensity Matching)步骤;(1)首先要对数据进行数据质量核查,鉴别数据类型,考察数据的完整性和逻辑性,然后根据数据类型和样本量大小来选择相应的倾向得分的分析方法。 ;(3)根据数据结构类型和选定的模型来计算每一个试验对象的倾向得分,倾向得分在 0~1 之间,表示试验对象被分配到试验组或者对照组的概率。
;(4)选择合适的倾向得分应用方法。
PS 分层法、PS 匹配法和 PS 协变量校正法等。
以倾向得分匹配法为例,在估计出试验对象倾向得分之后,需要选择合适的算法计算出组间倾向得分之间的距离,也就是近似程度。
;6)在匹配前后,进行组间均衡性检验。
组间基线的均衡性优劣是评价倾向得分方法在实际应用中控制选择性偏倚及混杂效应的较好的指标。
传统上常用的均衡性检验方法是假设检验,但假设检验法存在先天不足,针对此问题 1986 年由 Flury 和 Reidwyl 提出了标准化差异法,给出了明确的定义和计算方法 。
;(7)对匹配后的数据集,选择合适的统计学分析方法来估计处理效??。
由于匹配后试验组和对照组之间的协变量均已均衡,数据可以看作是近似随机化的,如果选择了合适的统计学方法则可以得出真实可信的处理效应。经过匹配,每一个试验组个体都能在对照组找到一个或多个与之匹配的对照个体,所以我们在统计学处理时,也可以考虑类似配对设计的统计方法来进行分析。
;K近邻匹配即寻找倾向得分最近的k个不同组个体;近邻匹配法匹配的结果为最近的部分个体,然后进行简单算术平均;(8)对数据进行敏感性分析。
在一次试验中,好的匹配方法产生不完整的匹配集是不可避免的,哪怕采用最大化匹配也不能消除匹配的不精确。因此,如何在匹配的精度和完整度之间进行选择,值得探讨。由于匹配数据的不完整导致严重的偏倚要远远高于由于精度不够导致的偏倚。所以选择一种合适的匹配算法是十分重要的,因为它影响到处理效应的估计。比较数据集在匹配前后的精确度和完整度,以此来评价不同的匹配算法的优劣是至关重要的。 ;PSM的局限性:
PSM通常要求比较大的样本容量以得到高质量的匹配
PSM要求处理组与控制组的倾向得分有较大的共同取值范围;否则,将丢失较多观测值,导致剩下的样本不具有代表性
PSM只控制了可测变量的影响,如果存在依不可测变量选择,仍会带来隐性偏差;倾向得分匹配举例——培训对工资的效应;倾向得分匹配举例——培训对工资的效应;倾向得分匹配举例——培训对工资的效应;倾向得分匹配举例——培训对工资的效应;倾向得分匹配举例——培训对工资的效应;倾向得分匹配举例——培训对工资的效应;倾向得分匹配举例——培训对工资的效应;倾向得分匹配举例——培训对工资的效应;偏差校正匹配估计量(bias-corrected matching estimator);由于在倾向得分匹配第一阶段估计倾向得分时存在不确定性,Abadie and Imbens(2002,2004,2006,2011)又重新回到更简单的马氏距离,进行有放回且允许并列(ties)的k近邻匹配,针对非精确匹配一般存在偏差,提出了偏差校正的方法,通过回归的方法估计偏差,然后得到偏差校正匹配估计量。;双重差分倾向得分匹配;前面几种匹配估计量均依赖可忽略假定,即可测变量选择,对于观测数据,如果怀疑存在依不可测变量选择,大致有以下几种处理办法:
尽量使用更多的相关可测变量,以满足可忽略假定
若处理变量的不可观测变量不随时间而变,而且有面板数据,则可使用双重差分倾向得分匹配估计量
使用断点回归法,特别是模糊断点回归
您可能关注的文档
最近下载
- XGZ系列刮板输送机图册.pdf
- 第10课《 再塑生命的人》课件(共22张ppt)部编版语文七年级上册.pptx VIP
- 近5年上海市高考语文真题之书序、游记类文言文阅读汇编.docx VIP
- 00708装饰材料与构造-全国自考-2021年4月高等教育自学考试真题(试卷).pdf VIP
- XGZ系列铸石刮板输送机.doc
- 小学篮球原地运球、行进间运球教案.doc
- 中国林业研究院806有机化学考研真题试题2020年.pdf VIP
- 中国林业研究院806有机化学2019考研真题试题.pdf VIP
- 2024年初级咖啡师技能鉴定考试题库大全-上(单选题汇总).docx
- 2024-2030年中国氦(液氦和气态氦)行业市场发展趋势与前景展望战略分析报告.docx
文档评论(0)