- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
?
?
基于分位数回归的上海市互联网行业工资水平研究
?
?
韩春慧李文
摘要本文利用回归分析中较为稳健的分位数回归方法,研究了上海市互联网行业中,就业人才的不同特点对企业提供的就业工资水平的影响,将学历、工作经验、企业自身规模这3个重要的影响因素作为自变量,工资水平作为因变量建立分位数回归模型。本文主要分析了5个主要的分位点,得到不同位置上的自变量对于工资水平影响更全面的结论。不同位置上的回归结果表明,在较高工资水平上,工作经验对企业提供的工资水平影响最大,并且呈现出上升的趋势,教育水平对于高层次人才的工资水平的影响随着所考察的分位数不同而变化,但并不是简单的上升趋势,在较高工资水平上,呈现出类似倒“U”形状的分布。
关键词分位数回归倒“U”形状工资水平教育水平
一、引言
近年来,互联网行业不断发展,人工智能等新兴的科技领域越来越需要高端人才的创新与实践,国家大力支持战略性产业的发展,实行相关政策,重点规划城市的发展。上海提出建立全球科创中心,以科技和创新引领行业发展,同时吸引了许多人才,也有越来越多的互联网企业在人工智能、大数据等新兴领域取得了成绩,同时大数据已成为国家基础性战略资源,对经济社会发展各领域日益产生深远的影响。本文利用大数据技术进行数据分析,聚焦上海提出的科创中心战略重点发展行业,从互联网行业入手,利用工资水平等数据,建立模型进行分析,对就业与上海重点行业发展的互动关系展开研究,尝试分析其所反映出的产业发展状况。
二、分位数回归介绍
分位数回归(QR)的思想最初是由Koenker和Bassett提出的,这一方法是对最小二乘法(OLS)的拓展和应用。分位数回归迅速发展主要是因為相比普通最小二乘法得到的回归,分位数回归具有自身独有的优点。传统的均值回归在使用普通最小二乘法时,对于模型有非常严格的假定,即假定随机扰动项满足零均值、同方差并且无序列相关性,较强的假定限制了这一方法在许多实际问题研究中的应用。当不满足其中任何一个假定时,会对所建立的模型造成无法估计的影响,从而使模型的建立失去意义。分位数回归理论的提出解决了这一弊端,相对于普通最小二乘法的严格假定,分位数可以应用于存在严重异方差,以及数据分布具有尖峰或厚尾的数据,应用的范围更加广泛,也更加深入地挖掘出数据所隐藏的信息,给我们研究分析问题提供了更好的思路和解决方案。
三、实证分析
(一)数据及其预处理
本文通过大数据分析中的爬虫等方法抓取了2018年上海市互联网行业招聘人员的基本信息,其中包括有关公司的信息如行业类别、公司特征、公司规模、提供的最低薪酬等,为互联网行业的各类公司提供有关从业人员的信息如工作经验、教育水平等。由于模型中需要探究的变量为工资水平、企业规模、从业人员的工作经验和教育水平,所以本文将样本中缺失相关信息的较少量样本删除,最终得到的样本量为34053个,样本量满足数据分析的要求,后期得到的模型也较为合理。同时,在进行建模分析时,根据模型的需要,本文将数据中的分类数据转换成顺序数据,以此建立模型,进一步分析变量对工资水平的影响。因变量采用的是最低薪酬数据,并对其进行对数化处理。数据分析使用的软件是Stata。
(二)建模分析过程
其中ln(wage)表示工资收入的自然对数,edu表示受教育程度,exp表示潜在工作经验(从事工作时间),squ则表示潜在工作经验的平方,Xi表示一系列控制变量所组成的矩阵,i表示样本中的观察个体。教育回报率是描述教育与收入之间关系的常用指标,指的是每增加一年的教育程度所带来的工资收入增加的百分比。由于被解释变量是对数形式,edu的系数可直接视为教育回报率。在不考虑个体异质性的情况下,教育回报率是既定的,但是每个人都有不一样的受教育年限,因此每个人有不同的收入。
建立分位数回归模型,将数据进行预处理,得到分析的数据。首先,对变量进行如下处理,本文将工资水平的对数作为被解释变量y,将公司规模、教育水平和工作经验作为解释变量x,建立如下分位数回归模型:
分位数回归模型是在不同的分位点下的条件回归,模型中估计的参数随着分位点t的不同而变化,建立的分位数回归模型含有三个自变量,均为虚拟变量。
(三)分位数回归结果及其解释
采用分位数回归模型能得到任意分位点的模型参数估计值,但是由于分析问题的具体情况时并不是越多的分位点就有越好的分析结果,本文采用比较具有代表性的5个分位点进行分析,分别是0.1、0.25、0.5、0.75、0.9。
Stata仍报告了OLS下估计方程的回归系数,尽管本文没有使用OLS方法,但是这一结果给了我们一个参照和对比,从OLS的回归结果可以看出,公司规模在模型中的贡献较小,工作经验和教育水平对工资水平的影响较大,这符合之前许多学者对于教育回报率和工作经验对收入影响的研究。从工作
文档评论(0)