- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
?
?
基于舞弊三角理论的GA-BP舞弊智能识别与大数据应用研究
?
?
赵于卓黄子莹
摘要:本文在回顾舞弊识别理论、指标和模型研究相关文献的基础上,以482个舞弊公司和非舞弊公司为研究样本,基于舞弊三角理论选取财务指标、财务增量指标和非财务指标构建综合指标体系,得到GA-BP舞弊识别模型。大数据技术下数据全面化、多维化的特点赋予审计对象,审计过程多元化、复杂化的特征,给审计工作带来新的挑战,将大数据技术和舞弊识别模型创新结合能赋予审计工作以新的生命力,为全面审计提供坚实的基础,提高审计质量和效率。
关键词:财务舞弊;GA-BP模型;舞弊三角理论;大数据
:F275:A:2096-0298(2021)06(b)--05
近年来国内财务舞弊案件迭出,如2019年的康美药业、康得新以及2020年的瑞幸等,不仅损害了投资者利益和市场可信度,影响证券市场资源配置功能的发挥,还对中国上市公司的声誉造成严重影响。舞弊动因更加复杂多样,舞弊方式不断新式化,国家对上市公司的监管也日益加强,识别公司财务舞弊的方法成为社会焦点。
本文以舞弊三角理论为基础,结合前人已有研究,构建了基于财务信息与非财务信息的指标体系,共计64个指标,作为智能算法识别舞弊的基础。根据412个公司样本拟合,并用70个样本进行测试,得到了一个精准有效的GA-BP舞弊识别模型。同时将模型进行扩展,为构建一个以数据处理为核心组织,基于大数据技术进行自动分析与识别的审计框架提供了初步方案。
1文献综述
1.1舞弊动因理论
孙丽亚(2010)从“三元素”理论出发,分析三元素的内在关系,创建了与舞弊特征相关的识别卡。洪荭等(2012)利用“GONE”理论探究得出影响五项舞弊发生的重大因素。此外,管杨威等(2014)选择“CRIME”舞弊动机五因素论为研究依据,对60个上市公司舞弊与非舞弊样本进行对比检验获得较好应用能力的识别模型。
1.2舞弊指标
彭子坤等(2013)立足非财务指标从舞弊行为的根本原因出发认识该行为,以公司治理信息和外部环境信息来对非财务信息进行分类,分析现在舞弊识别中的缺陷与滞后性。而熊方军(2015)立足财务指标,通过对几十家舞弊和非舞弊公司的16个财务指标构建以Logistic模型为基石的舞弊识别方法,对数据进行剖析后认为:公司财务指标的数据样本容量大小影响着预测正确率,容量越小正确率越高。
1.3舞弊识别模型
夏明等(2015)选取神经网络组合模型,以BP、RPF神经网络的实验结果为基础,提出RPF-BP组合模型,效法于生物体内神经网络,具有较好的自适应及容错性和应用性,为有效识别会计舞弊提供了新的思路和方法。与之不同的是杨贵军等(2019)使用基于Benford律的Logistic模型,创造性地提出创建一个Benford因子并将其带入到Logistic模型。另外,潘梦雪(2019)基于有较高准确率的预测算法随机森林,结合2014—2017年400多家有舞弊行为的公司进行建模验证,得到具有实用价值的风险识别模型。
由上述的文献可以得知,在舞弊识别模型、指标、舞弊动因理论的选择上,学术界针对不同方向都得到了较为丰富的成果。本文旨在前人研究的基礎上进行创新性优化,以期获得具有更高可信度和实用价值的舞弊识别模型。
2GA-BP模型构建
2.1神经网络选取
人工神经网络中的BP(BackPropagation)神经网络应用最为广泛,其常见结构有三层,分别是输入、隐含与输出层,不同层之间的神经元之间可以利用通道进行信息传输。神经元与通道构成了一个非线性有向图,具有很强的学习能力与处理能力,可以根据输入数据修改每条通道的权重,从而映射出未知结构的数据关系。
该模型的重点在于权矩阵的确定。选取个学习样本,每个样本有个指标值和1个输出值,所以期望输出值构成了目标向量,输出值构成了向量,把与之间的误差逐层逆向传递给上一层,通过不断修正神经元间信号通道的权重来减少误差,当误差减小到预先设定的标准,则学习状态结束。
2.2遗传算法优化
虽然BP神经网络的学习能力较强,但收敛速度较慢,易困于局部最优解,为克服这一缺点选用遗传算法(GeneticAlgorithm,GA)进行优化。遗传算法借鉴自然界遗传机制与适者生存思想,模拟生物遗传进化过程,通过选择、交叉、变异等操作循环繁殖来挖掘最优个体,缩小最优解范围,用于优化BP神经网络模型的权值阈值。
2.3GA-BP模型构建
GA-BP模型算法的主要步骤如下。
2.3.1网络初始化
首先需要确定神经网络的拓扑结构,包括网络层数和权值阈值个数,并赋予初始值,确定网络的学习规则,这里引入动量项,使得学习因子可以根据需要变化。其中
为学习因子,影响网络收敛速度;为动量因子,影响误差修正力度,一般取0.9。
文档评论(0)