- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Economics 20 - Prof. Anderson 虚拟变量 虚拟变量是取值为1或0的变量 例子: 男性 (= 1 表明是男性, 0表明不是男性),南部 (= 1 表明在南部, 0表明不在南部), 等等. 由于明显的原因,我们也称虚拟变量为二值变量 一个虚拟自变量 我们来考虑一个具有一个连续变量(x)和一个虚拟变量(d)的简单模型 y = b0 + d0d + b1x + u 我们能将这解释为一个截距变动 如果d = 0,那么y = b0 + b1x + u 如果d = 1,那么 y = (b0 + d0) + b1x + u d = 0的情形是基组 用于多元分类的虚拟变量 我们能利用虚拟变量来控制具有多元分类的事物 假设在你的数据中的每个人要么高中未毕业, 或者仅高中毕业或者大学毕业 为了将高中和大学毕业与高中未毕业进行比较, 我们包含了两个虚拟变量(hsgrad和colgrad) 如果仅高中毕业那么hsgrad = 1,否则hsgrad = 0; 如果大学毕业那么colgrad = 1,否则 colgrad = 0 用于多元分类的虚拟变量(续) 我们能将任何一个分类变量转化为一组虚拟变量 因为基组由截距表示, 所以如果有n个分类那么应该有n– 1个虚拟变量 如果分类太多, 那么合并一些分类也许是有意义的 例子: 排名前10名, 11 – 25, 等等 虚拟变量之间的交互作用 交互式虚拟变量就象细分组 例子: 我们有虚拟变量male、hsgrad和colgrad 我们增加两个虚拟变量male*hsgrad和male*colgrad, 5个虚拟变量对应于6个分类 基组是女高中未毕业 hsgrad是女高中毕业生, colgrad是女大学毕业生 虚拟变量的交互作用male*hsgrad和male*colgrad分别表示男高中毕业生和男大学毕业生 关于虚拟变量之间交互作用的更多内容 形式上, 模型是 y = b0 + d1male + d2hsgrad + d3colgrad + d4male*hsgrad + d5male*colgrad + b1x + u, 于是, 例如: 如果male = 0并且hsgrad = 0并且colgrad = 0, 那么y = b0 + b1x + u 如果male = 0并且hsgrad = 1并且colgrad = 0, 那么y = b0 + d2+ b1x + u 如果male = 1并且hsgrad = 0并且colgrad = 1, 那么y = b0 + d1+ d3 + d5+ b1x + u 关于虚拟变量的其他交互作用 我们也可以考虑一个虚拟变量d与一个连续变量x的交互作用 y = b0 + d0d + b1x + d1d*x + u 如果d = 0, 那么y = b0 + b1x + u 如果d = 1, 那么y = (b0 + d0) + (b1+ d1) x + u 我们将这解释为斜率的一个变化 检验不同组之间回归函数上的差别 我们能将检验一组的回归函数是否不同于另一组的回归函数认为只是对虚拟变量和它与所有其他x 变量的交互作用的显著性检验 因此,虽然你可以估计带有所有交互项和不带交互项的模型并构成一个F统计量, 但是这可能是繁琐的 邹至庄检验 结果是你不需要运行带有k 个连续变量的所有交互项的无约束模型, 就能计算出适当的F统计量 如果运行第一组受约束模型并得到SSR1,那么运行第二组受约束模型并得到SSR2 运行两个组合并的受约束模型来得到SSR, 于是 邹至庄检验(续) 对于排除性约束来说,邹至庄检验实际上只是一个简单的F 检验,但是我们已经认识到 SSRur = SSR1 + SSR2 注意, 我们有 k + 1个约束 (即每一个斜率系数和截距) 注意:无约束模型会估计出两个不同截距和两个不同的斜率系数, 因此df是n – 2k – 2 线性概率模型 P(y = 1|x) = E(y|x),考虑到y是一个二值变量, 因此我们可以将我们的模型写为 P(y = 1|x) = b0 + b1x1 + … + bkxk 因此, 我们能将bj解释为当xj发生变化时y = 1的概率变化 y的预测值是y = 1的概率预测值 潜在的问题是y的预测值会超出[0,1] 线性概率模型 (续) 即使预测值不会超出[0,1], 我们可以估计x的一个变化使y = 1的概率变化到超过+1或–1的效果, 因此最好使用均值附近的变化 该模型将违反同方差性的假定, 因此该模型将影响推断 尽管该模型有缺点,但是当y是二值变量时它通常是一个良好开端 项目评价的注意事项 一个虚拟变量的一个典型用途是将它用在当我们正在考察一个项目产生的效应的时侯 例如, 我们中
您可能关注的文档
- 第六课 罗马法的起源和发展.ppt
- 2017-2018学年中心学校工作计划.doc
- 第六章 幼儿园环境.ppt
- 第六章 工业企业供电与用电安全技术.ppt
- 城市园林绿地系统规划.doc
- 第六章 小组社会工作.ppt
- 2017春季幼儿园园长工作计划精选.doc
- 2017春教导处工作计划.doc
- 第六章 财务会计报告.pptx
- MATLAB 非线性规划 建模 灵敏度分析.pptx
- 鼎帷咨询-华为汽车发展战略研究报告-84页.docx
- 人工智能行业专题:IDC建设周期在即,关注国产算力机遇-国信证券.docx
- 源力增长:2024中国餐饮企业穿越周期之道研究报告.docx
- 房地产行业土地增值税合规报告(2025).pdf
- 人工智能行业深度研究报告.docx
- 字节AI深度:战略布局、产业趋势、产业链及相关公司深度梳理(2024).docx
- 【凯爱瑞】2024捕捉华夏民族珍味-咸味主食与咸味零食创新机遇报告.docx
- AIGC之AI绘画行业发展研究报告2023.docx
- 房地产 -深圳甲级写字楼市场季度报告 2024年第二季度.pdf
- 房地产 -深圳甲级写字楼市场季度报告 2024年第三季度.pdf
文档评论(0)