- 1、本文档共40页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
南京师范太学2003年砸{:研究生毕业论文
南京师范太学2003年砸{:研究生毕业论文 璀于决镱树的分类方法研究
摘要
厂
{数掘挖掘,又称数据库中的知识发现,是指从大型数据库或数据仓库中提取
具有潜在应用价值的知识或模式。模式按其作用可分为两类:描述型模式和预测 型模式。分类模式是一种重要的预测型模式。挖掘分娄模式的方法有多种,如决 策树方法、贝叶斯网络、遗传算法、基于关联的分类方法、羊H糙集和k一最临近方
、 /
法等等。,/驴
I
本文研究如何用决策树方法进行分类模式挖掘。文中详细阐述了几种极具代 表性的决策树算法:包括使用信息熵原理分割样本集的ID3算法;可以处理连续 属性和属性值空缺样本的C4.5算法;依据GINI系数寻找最佳分割并生成二叉决 策树的CART算法;将树剪枝融入到建树过程中的PUBLIC算法:在决策树生 成过程中加入人工智能和人为干预的基于人机交互的决策树生成方法;以及突破 主存容量限制,具有良好的伸缩性和并行性的SI,lQ和SPRINT算法。对这些算 法的特点作了详细的分析和比较,指出了它们各自的优势和不足。文中对分布式 环境下的决策树分类方法进行了描述,提出了分布式ID3算法。该算法在传统的 ID3算法的基础上引进了新的数掘结构:属性按类别分稚表,使得算法具有可伸 缩性和并行性。最后着重介绍了作者独立完成的一个决策树分类器。它使用的核 心算法为可伸缩的ID3算法,分类器使用Microsoft Visual c++6.0开发。实验结 果表明作者开发的分类器可以有效地生成决策树,建树时间随样本集个数呈线性
增长,具有可伸缩性。 。
,,荡囊
关键字: 数据挖掘1分类规则,决策树,分布式数据挖掘
南京师范大学2003年硕士研究生毕业论文
南京师范大学2003年硕士研究生毕业论文 娃于决策树的分类方法研究
Abstract
Data mining,referred to as knowledge discovery in databases,is the extraction of paRems representing valuable knowledge implicitly stored in large databases or data warehouses.Classification is a form of data analysis that Call be used to extract
models describing important data classes.There are many techniques for data classification such as decision tree induction,Bayesian classification and Bayesian
belief networks,association·based classification,genetic algorithms,rough sets,and k—nearest neiighbor classifiers.
This paper introduces the decision tree method for classification.Firstl ysome basic algorithms for inducing decision tree are discussed,including ID3,which uses information gain to select a splitting attribute when partitioning a training set;C4.5, which Can deal with numeric attributes;CART,which Bses G]NI rule in attribute selection and induces a binary tree;PUBLIC,which puts tree pruning in the tree
building phase;Interactive method,which puts Artificial Intelligence and human·computer interaction into the procedure of decision tree induction;as well as SLIQ
您可能关注的文档
- 基于可持续发展理念的绿色设计产业化可行性研究-设计艺术学专业论文.docx
- 基于三维可视化的路面损坏计算方法研究-交通信息工程及控制专业论文.docx
- 基于阵列探头的铝板缺陷超声检测仿真及其定位研究-精密仪器及机械专业论文.docx
- 基于无线AdHoc网络的动态源路由协议的研究与实现-软件工程专业论文.docx
- 基于涡度相关法和无线传感网的雷竹林碳通量估算-森林经理学专业论文.docx
- 基于系统动力学与无线传感技术的无锡碳收支研究:以东南大学无锡校区为例-生态学专业论文.docx
- 基于图像特征的数字水印技术研究-电路与系统专业论文.docx
- 基于微结构光纤的折射率和pH值传感器研究-光电信息工程专业论文.docx
- 基于视频的交通流量检测技术研究与实现-软件工程专业论文.docx
- 基于神经网络的拼音汉字转换-计算机应用专业论文.docx
文档评论(0)