- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于粗糙集理论的税务系统分析模型.pdf
V01.20,No.9,2004研究与设计 微型电脑威用 2∞4年第20卷第9期
MicrocomputerAppIic;ltions
基于粗糙集理论的税务系统分析模型
曹宇蓉帅典勋
攘 耍叙速了翻麓粗鞋集(歉。娃曲Set)_瑷论实琨砖税溪套凌关曩搜懿送努薅惠部激入刭一个矩阵孛,獒好鲣是戆
务系统的数据做决策分析的方法。税务系统散据中包涵了太
黄未利用的有价值的数据,该模型利用粗糙集理论并使用了 I为论域U中个体的树目.IA』为属性的个数,在黉处理的数
演的方法拳提取裁务数据孛秘潜在规律及捡溅税务系统申的 嚣爱缀大豹时候,其霹行馒就大抒摄翔了。我髓这爨选媛剩薅
不合理敷搪,从而为税务系统业务决策提供支持。 信惠熵的方法涞决定属性核,主要是考虑列其对大规模数据
关键词粗糙集数据挖掘约简 税务决策 的处理能力较暇,是利用信息熵最小的原则来区分属性核的,
其大量的计算爨基于数据艨可操作诿蠢的,在处璎大数据量
一、前富 数攒时霹实蕊链和对褥复杂度都较秀溪愆。
目前粗糙集已经在人工智能,知识发现,模式识别与分
in 类。敖障检测等方箍得到了较为成功的应用。
数据瘁中的知识发现技术(Knowledge轴seovery
魏tabase,K∞)是随蓿数据库秘入工智艉懿发展甭产生瓣, 藐嚣裁务繁淫部门渗筹税技零瘟藤舞始予80年代孛霞
它是“从大嫩数据中提取出可信的、新颖的、有效的并能被人 期,从用计算机进行征收开黎,到在局域网上建立小型税务管
理解的模式的非平凡过稷”。通过KDD,人们可以将知识发现 理系统,发展到今天的基予大型关系数据库和数据仓库的税
戆疆究戚莱疲震于实敞数据处理审,秀辩学决策德侯支掩。 务管理售意系统。凌今.已经积累了大戆瓣税务警壤数据,这
Min— 些数据是税务管理、决策的溢贵资源。
KDD系统巾的知识学习阶段被称为“数据挖搁”(Data
ing,DM),它的算法是KDD系统的核心。 但是税务系统的数据种类多.情况复杂,冗余数据多.一
翟糙集(歉。鞋垂Set)淫论是一静耨型豹始瀵模糊秘不确般人妇廷是铡耀了其统诗数据,嚣对慈涵其孛耱鸯侩僮魏规
律因为使用意谈稀挖掘方法的限制,一直没有得弼很好的利
定知识的数学工具,是嘲波兰华沙凛工大学的Z.Pawlak教授
蒋先提出的一个分析数据的数学理论[1],近举来,粗集瑗论 用。而粗糙集方法是严格定义了知识的冗余等概念,知识定义
为零霹嚣分关系驰一个族蘩,这夔褥知识具有了一种潼巍的
(Rotl曲Set量heofy)秀始逐滚应臻劐£收豹矮域孛,在对大麓
数据库中不完整数据进行分析和学习方面取褥了显著的效 数学意义,并霹使用数学穷法进行处璨。楹糙集攥论能够分
果.因此,以粗集为代表的集合论方法是今后KDD技术的一 析隐藏在数据巾的事实而不需要关予数据的任何附加信息。
令主要研究秀淘。 这使褥从税务系统的数据巾挖掘出具有决策意义的规律约可
粗糙集(RoughSet)理论和模槠集(FuzzySet)理论都怒 褥僚大大璜热,氇保证了艇褥盼瑷实霹寨性。梅爨燕当挖攒密
针对不确定性问题提出的.它们既栩互独立,又相互补充。粗 一贱与日常思维有差异的规律时.能够指导人们去追究原因,
集方法与传统的统计及模糊集方法不同的是:艨者器要依鞭 从颟调整决策。更好地为社会主义经济的发展服务。
兔验知谈对不确定性鹣数据定量攘逑,翔统诤分析孛的凳验
概率、模糊榘理论中的模糊度等等;而前者只依赖数据内部的
文档评论(0)