数据仓库与数据挖掘实验指导书 .doc

  1. 1、本文档共73页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库与数据挖掘实验指导书 

                               《数据仓库与数据挖掘》实验指导书      (适用于信息系统与信息管理专业)                                    目 录     TOC \o 1-1 \h \z \u HYPERLINK \l _Toc259045080 前 言 PAGEREF _Toc259045080 \h 1    HYPERLINK \l _Toc259045081 实验一、SPSS Clementine 软件功能演练 PAGEREF _Toc259045081 \h 5    HYPERLINK \l _Toc259045082 实验二、SPSS Clementine 数据可视化 PAGEREF _Toc259045082 \h 9   HYPERLINK \l _Toc259045083 实验三、决策树C5.0 建模 PAGEREF _Toc259045083 \h 10  HYPERLINK \l _Toc259045084 实验四、关联规则挖掘 PAGEREF _Toc259045084 \h 21   HYPERLINK \l _Toc259045085 实验五、欺诈屏蔽/异常检测/神经网络 PAGEREF _Toc259045085 \h 29   HYPERLINK \l _Toc259045086 实验六、分类和回归树节点(CRT) PAGEREF _Toc259045086 \h 40   HYPERLINK \l _Toc259045087 实验七、多项 Logistic 回归 PAGEREF _Toc259045087 \h 50    HYPERLINK \l _Toc259045088 实验八、综合实验:电力负荷预测 PAGEREF _Toc259045088 \h 56            前 言   一、课程简介  数据挖掘(Data Mining),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。数据挖掘的广义观点:数据挖掘就是从存放在数据库,数据仓库或其他信息库中的大量的数据中“挖掘”有趣知识的过程。数据挖掘,又称为数据库中知识发现(Knowledge Discovery in Database, KDD),因此,数据挖掘和数据仓库的协同工作,一方面,可以迎合和简化数据挖掘过程中的重要步骤,提高数据挖掘的效率和能力,确保数据挖掘中数据来源的广泛性和完整性。另一方面,数据挖掘技术已经成为数据仓库应用中极为重要和相对独立的方面和工具。    数据挖掘有机结合了来自多学科技术,其中包括:数据库、数理统计、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像与信号处理、空间数据分析等,这里我们强调数据挖掘所处理的是大规模数据,且其挖掘算法应是高效的和可扩展的。通过数据挖掘,可从数据库中挖掘出有意义的知识、规律,或更高层次的信息,并可以从多个角度对其进行浏览察看。所挖掘出的知识可以帮助进行决策支持、过程控制、信息管理、查询处理等等。因此数据挖掘被认为是数据库系统最重要的前沿研究领域之一,也是信息工业中最富有前景的数据库应用领域之一。当前数据挖掘应用主要集中在电信、零售、农业、网络日志、银行、电力、生物、天体、化工、医药等方面。而据Gartner的报告也指出,数据挖掘会成为未来10年内重要的技术之一。      二、课程的任务和实验的教学目标    课程编号:5405190  课程属性:专业任选课    实验学时:12    适用专业:信息管理与信息系统  先修课程:管理信息系统、计算机基础、数据库技术、统计学    《数据仓库与数据挖掘》是一门理论和实践相结合的课程,它在整个信息系统与信息管理专业中处于信息系统应用的前沿应用的地位,是计算机科学的算法理论基础和数据库、数据仓库技术、统计技术的结合,以及在管理实践中应用。其上机实验的目的主要是实现数据挖掘的主要算法,训练学生实际动手进行数据挖掘设计和软件应用的能力,加深对数据挖掘相关概念和算法的理解。    本课程具有技术性和实践性较强的特点,因此,配合基本原理的讲授,应当安排相应的实习操作。通过实验和操作,使学生巩固和加深数据仓库与数据挖掘理论知识,进一步加强学生独立分析问题和解决问题的能力、综合设计及创新能力的培养,为今后工作打下良好的基础。经过多层次、多方式的全面训练后,学生应达到下列要求:  1.进一步巩固和加深数据仓库与数据挖掘基本知识的理解,提高综合运用所学知识,建立和管理数据的能力。    2.能根据需要选学参考书,查阅相关的工具,通过独立思考,深入钻研有关问题,学会自己独立

文档评论(0)

beoes + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档