策略深度:财务报表分析系列,机器学习在上市公司财务造假识别中的应用.docx

策略深度:财务报表分析系列,机器学习在上市公司财务造假识别中的应用.docx

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

目录

一、财务造假样本筛选及特征分析 2

、造假公司的样本整理 2

、造假公司的行业与时间分布 2

、造假的违规类型 4

、样本处理方式 5

二、财务造假特征的选择 5

、财务指标 5

、公司基本情况 6

、市场指标 7

、指标处理 7

、模型优化目标 8

三、造假预测Logistic回归模型建立 8

四、造假预测MLP神经网络模型建立 10

五、造假预测XGBoost模型建立 12

六、总结 15

七、风险提示 16

图表目录

图表1:财务造假的行业分布 2

图表2:财务造假的年份分布(左)财务造假持续年份的公司数量分布(右) 3

图表3:财务造假的行业分年度违规率(1) 3

图表4:财务造假的行业分年度违规率(2) 4

图表5:财务造假的行业分年度违规率(3) 4

图表6:财务造假的违规类型分布 5

图表7:公司基本情况指标 7

图表8:市场指标 7

图表9:Logistic回归的混淆矩阵(左)Logistic回归的评价指标(右) 9

图表10:Logistic回归的财务造假识别模型表现 9

图表11:Logistic中的特征变量重要性(前10项) 10

图表12:MLP的混淆矩阵(左)MLP的评价指标(右) 11

图表13:MLP的财务造假识别模型表现 11

图表14:MLP中的特征变量重要性(前10项) 12

图表15:XGBoost的混淆矩阵(左)XGBoost的评价指标(右) 13

图表16:XGBoost的财务造假识别模型表现 14

图表17:XGBoost中的特征变量重要性(前10项) 14

图表18:特征在各模型中重要性排序(前10项) 15

一、财务造假样本筛选及特征分析

上市公司的财务造假对市场造成了巨大的影响,给投资者们造成了巨大的损失,也给资本市场的健康发展带来了负面影响。如何通过各种信息判断出可能进行财务造假的公司,从而在投资前避开这些雷区,是投资者重点关注的问题。理论上,最彻底甄别财务造假的方法是对每一个公司逐一进行调查研究,但是由于上市公司数量过多,且造假手段层出不穷,导致成本太高。使用量化模型可以对市场上的股票进行一轮初筛,识别出一批造假概率较高的样本,从而帮助我们减少大量的人力成本。

、造假公司的样本

在财务造假样本筛选中,本文的数据来源于CSMAR数据库的“财务违规表”。该表从证监会,上交所以及深交所发布的公告中了发生财务造假的案例,共19482条。本文选择2001年1月1日之后的样本进行分析。

同时,由于财务造假的处罚公布具有滞后性,因此决定暂时不研究最近2年,即2022年12月31日之后的所有样本。

据CSMAR数据库统计,2001年至2022年期间,涉及虚构利润、虚列资产、虚假记载(误导性陈述)即财务造假被披露的事件共涉及到1503家上市公司,涉及3959条违规记录。在样本选择中,样本来源于2001年

1月1日至2022年12月31日受到中国证监会及上交所深交所披露的存在财务违规的中国A股上市公司对应

年报。部分上市公司还存在临时报告或者季度报告的造假情况,但此类报告与年报的部分财务指标不一致,故不纳入样本。

、造假公司的行业与时间分布

本文使用中信一级行业进行行业分类。从下图来看,财务造假公司的行业分布差异化较大。从绝对数量来看,机械、基础化工、医药等行业财务造假的数量非常多,是财务造假的重灾区。而煤炭和综合金融等公司造假的数量几乎没有。银行板块1999-2022年没有出现过财务造假案例。

图表1:财务造假的行业分布

数据来源:、CSMAR、

策略深度报告

在观测造假公司的时间分布时,本文将A股存在造假现象的所有年报作统计,包括一家公司多年连续发生造假行为的年报。从造假年份的分布来看,财务造假的数量呈现明显增多的趋势,在2018年达到顶峰。2018年之后,财务造假数量逐渐减少,推测可能是部分造假案例还没有被发现披露。总体而言,如何进行财务造假的甄别仍然值得关注。

许多公司的财务造假并不是一年的事情,而是长期、持续的造假,直到后面才被发现。从每个财务造假公司造假的年数来看,造假1年(被发现)的公司最多,大部分公司造假的年数都小于等于5年。也有少部分公

司有超过10年的财务造假。

图表2:财务造假的年份分布(左)财务造假持续年份的公司数量分布(右,单位:年)

数据来源:、CSMAR、

综合行业与时间,通过计算各年度中信一级分

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档