学位论文_数据挖掘课设报告.docVIP

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
学位论文_数据挖掘课设报告.doc

XI`AN TECHNOLOGICAL UNIVERSITY 课程设计报告 课程名称 数据挖掘 专 业: 信息管理与信息系统 班 级: 130513 姓 名: 贾丹丹 学 号: 130513117 指导教师: 李刚 成 绩: 2016 年 1 月 3 日 前言 数据挖掘就是从大量的数据中挖掘出有用的信息。它是根据人们的特定要求,从浩如烟海的数据中找出所需的信息来,供人们的特定需求使用。据国外专家预测,随着数据量的日益积累和计算机的广泛应用,在今后的5—10年内,数据挖掘将在中国形成一个新型的产业。 数据挖掘,在人工智能领域,习惯上又称为数据库中的知识发现(Knowledge Discovery in Database, KDD), 也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。知识发现过程由以下三个阶段组成:(1)数据准备(2)数据挖掘(3)结果表达和解释。数据挖掘可以与用户或知识库交互。数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。 数据挖掘中的分类反映同类事物共同性质的特征型知识和不同事物之间的差异型特征知识。最为典型的分类方法是基于决策树的分类方法。它是从实例集中构造决策树,是一种有指导的学习方法。该方法先根据训练子集(又称为窗口)形成决策树。如果该树不能对所有对象给出正确的分类,那么选择一些例外加入到窗口中,重复该过程一直到形成正确的决策集。最终结果是一棵树,其叶结点是类名,中间结点是带有分枝的属性,该分枝对应该属性的某一可能值。 ?? 目录 1 业务理解 1 2 数据理解 1 2.1英文版数据说明 1 2.2数据的读入 2 2.3浏览数据内容 2 2.4指定各个变量的作用 3 2.5观察各变量的数据分布特征 4 3 数据准备 4 3.1对数据进行重新分类 4 3.2对数据进行平衡处理 6 4 建立决策树模型 6 4.1 C5.0,CART,CHAID算法介绍 7 4.2模型建立 8 4.3模型计算结果 14 4.4模型结果分析 17 5 模型评估 18 6 总结 20 附录1:zoo.date 21 附录2:zoo.names 24 1 业务理解 动物园动物数量大,种类多,对动物园的动物根据它们的特征进行分类,以便于观察和分析动物的特征,进而更加合理的管理动物以及为未来查找动物信息提供参考。 2 数据理解 该数据集是从UCI网站上获得的一份关于动物园的动物的数据。该数据是收集的动物园中99种动物的特征,包括hair,feathers ,eggs,milk,airborne,aquatic ,Predator,toothed,backbone,breathes,venomous,fins,legs,tail,domestic,catsize 。现需利用数据挖掘将这些动物进行分类,分成7种类型。 2.1英文版数据说明 Source: Creator:? Richard Forsyth? Donor:? Richard S. Forsyth? 8 Grosvenor Avenue? Mapperley Park? Nottingham NG3 5DX? 0602-621676 Data Set Information: A simple database containing 17 Boolean-valued attributes. The type attribute appears to be the class attribute. Here is a breakdown of which animals are in which type: (I find it unusual that there are 2 instances of frog and one of girl!)? Class# -- Set of animals:? 1

文档评论(0)

damei + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档