金融计量-金融数据多重共线性的处理选编.docx

金融计量-金融数据多重共线性的处理选编.docx

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
金融数据的多重共线性处理 -对影响股票价格指数宏观经济因素的实证分析 实验目的 金融数据多重共线性的存在,虽然不会改变最小二乘估计的无偏性,但是会对模型的估计、检验与预测产生严重的不良后果。例如,参数估计值的方差无限大,参数估计值不稳健等。通过对多重共线性的检验和修正,可以将原模型的多重共线性减轻或者消除。 理论依据 理论上,股票代表着对公司未来现金流的所有权,因此公司未来的收益以及利息是股票价格的决定因素。而宏观经济形势能够影响公司未来的收益,进而对股票价格产生影响。同时宏观经济形势也能通过其他的一些渠道直接对股票价格产生影响。 本实验中,选择上证综指Y作为股票价格指数的代表。对于影响股票价格指数的宏观经济因素,初步选定以下11个宏观经济变量:居民消费价格指数X1,商品零售价格指数X2,社会消费品零售总额X3,进出口总值X4,货币供应量(M1) X5,银行结汇数据X6,人民币兑美元汇率中间价X7,固定资产投资完成额X8,工业增加值增长速度X9,工业生产者出厂价格指数X10和股市成交量X11。选用的数据范围是2010年1月到2015年12月。 实验步骤 1.数据下载与处理 在选取的12个变量中(包括Y),对下载到的数据进行以下处理。 上证综指Y:网上下载到每日数据之后,选取每月最后一天收盘价作为当月数据。 居民消费价格指数X1:直接下载得到当月数据,上年同月=100。 商品零售价格指数X2:直接下载得到当月数据,上年同月=100。 社会消费品零售总额X3:直接下载得到当月数据,单位亿元。 进出口总值X4:直接下载得到当月数据,单位千美元。 货币供应量(M1) X5:直接下载得到当月数据,单位亿元。 银行结汇数据X6:直接下载得到当月数据,单位亿元。 人民币兑美元汇率中间价X7:网上下载到每日数据之后,选取每月最后一天的数据作为当月数据。 固定资产投资完成额X8:直接下载得到当月数据,单位亿元。 工业增加值增长速度X9:直接下载得到当月数据,单位%。 工业生产者出厂价格指数X10:直接下载得到当月数据,上年同月=100。 股市成交量X11:网上下载到每日数据之后,加总每月的日数据之和作为当月数据。 2.建立模型并直接进行回归 对下载到的数据进行简单处理后,建立模型如下: Y=α0+α1X1+α2X2+α3X3+α4X4+α5X5+α6X6+α7X7+α8X8+α9X9+α10X10+α11X11+ut 将数据导入Eviews软件,进行普通最小二乘法回归,得到结果如下图。 由回归结果可以看出,直接对Y、X1、X2、X3、X4、X5、X6、X7、X8、X9、X10、X11进行回归时,相关系数较高,为0.88,也能通过F检验。但是仅有X7和X11两个变量可以通过t检验(取显著性水平=0.1),于是下面对部分数据进行对数调整。 3.进行对数调整 对于价格指数、汇率等变量,不作处理;对其他变量包括Y,进行对数处理。对数调整之后的模型为: lnY=α0+α1X1+α2X2+α3lnX3+α4lnX4+α5lnX5+α6lnX6+α7X7+α8lnX8+α9X9+α10X10+α11lnX11+ut 利用最小二乘法得到结果如下图所示。 由回归结果可以看出,对lnY、X1、X2、lnX3、lnX4、lnX5、lnX6、X7、lnX8、X9、X10、lnX11进行回归时,相关系数也较高,为0.85,也能通过F检验。但是能通过t检验的变量还是仅有X7和lnX11两个。于是想到对价格指数进行调整。 4.对价格指数进行调整 在第一部分数据下载与处理中提到,对于价格指数类变量X1、X2、X10,都是以上年同月为基期的,这可能影响了模型的准确性。于是对价格指数进行调整,将基期都固定为2010年,利用Excel进行处理后,重新进行回归,得到结果如下。 由回归结果可以看出,对价格调整过后的lnY、X1、X2、lnX3、lnX4、lnX5、lnX6、X7、lnX8、X9、X10、lnX11进行回归时,相关系数也较高,为0.83,也能通过F检验。但是能通过t检验的变量仅有X7、X10、lnX11三个。 保留X7、X10、lnX11这三个自变量,剔除其他自变量,重新进行回归,结果如下图。 这时可以发现,X10又变得不显著了,只留下X7和lnx11这两个变量。 5.去掉不显著的变量 考虑到本实验的模型中自变量太多,可能由于某些自变量与Y相关度很低,而导致回归的结果十分不理想。于是去掉对价格调整过后的lnY、X1、X2、lnX3、lnX4、lnX5、lnX6、X7、lnX8、X9、X10、lnX11进行回归时,P值最高,即最不显著的X2和 lnX8,重新对lnY、X1、lnX3、lnX4、lnX5、lnX6、X7、X9、X10、lnX11进行回归,回归结果如下图。 由回

文档评论(0)

1112111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档