- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
昆明理工大学信息工程与自动化学院学生实验报告
( 2011 —2012 学年第 1 学期 )
课程名称:数据仓库与数据挖掘 开课实验室: 信自楼445 2011年 12月 7日
年级、专业、班 计科081 学号 200810405130 姓名 孙永星 成绩 实验项目名称 数据挖掘 指导教师 周海河 教师评语 提前预习实验内容、自觉遵守考勤和规章、按时参加实验和交付实验报告(30分)。
二、检查实验数据、数据记录、完整正确(10分)。
三、技术路线图、数据表格、公式、特性曲线、波形绘制符合规范要求(10分)。
四、报告基本内容(包括实验目的、实验原理、实验技术路线、实验条件、实验方法步骤、实验数据及处理)完整(10分)。
五、独立完成实验、有实验分析和总结(10分)。
六、报告书写工整、条理清楚、概念正确、逻辑性强、语言流畅(10分)。
七、现场实验操作技能熟练(10分)。
八、有个人的见解或创新(10分)。
教师签名:
年 月 日 一、实验目的
1.理解数据挖掘的基本概念及其过程;
2.理解数据挖掘与数据仓库、OLAP之间的关系;
3.理解基本的数据挖掘技术与方法的工作原理与过程,掌握数据挖掘相关工具的使用。
二、实验原理及基本技术路线图(方框原理图)
将创建一个数据挖掘模型以训练销售数据,并使用“Microsoft 决策树”算法在客户群中找出会员卡选择模式。请将要挖掘的维度(事例维度)设置为客户,再将 Member_Card 成员的属性设置为数据挖掘算法识别模式时要使用的信息。然后选择人口统计特征列表,算法将从中确定模式:婚姻状况、年收入、在家子女数和教育程度。下一步需要训练模型,以便能够浏览树视图并从中读取模式。市场部将根据这些模式设计新的会员卡,使其适应申请各类会员卡的客户类型。
三、上机平台、环境
操作系统:Windows 7
数据库:SQLServer2008
四、实验方法、步骤
新建数据表:大理PAS流失训练
CREATE TABLE [dbo].[大理PAS流失训练](
[SERV_ID] [float] NULL,
[CUST_ID] [float] NULL,
[ZWSC] [float] NULL,
[BILLING_MODE_ID] [float] NULL,
[PAYMENT_METHOD] [float] NULL,
[ORG_ID] [float] NULL,
[NEW_YXSX] [float] NULL,
[ZWSC_DSC] [nvarchar](255) NULL,
[KB] [nvarchar](255) NULL,
[AGE] [nvarchar](255) NULL,
[LX] [nvarchar](255) NULL,
[CL] [nvarchar](255) NULL,
[FEE_ALL] [nvarchar](255) NULL,
[YC] [nvarchar](255) NULL,
[IS_LS] [float] NULL
) ON [PRIMARY]
导入数据
在数据源视图中添加“大理PAS流失训练”表
使用新建数据挖掘向导创建数据挖掘结构
使用决策树算法
指定输入列和可预测列以及键
指定列的内容和数据类型
创建测试集 指定测试数据百分比为50%
指定数据挖掘的名称
处理并得到预测值和实际值的对比矩阵
查看挖掘结构
查看挖掘模型
挖掘模型查看器
六、实验结果分析、经验总结或结论(例如对实验获取数据的误差分析、数据处理、成果等。其中,绘制曲线图时必须用标准计算纸,不得随意用普通白纸绘画)
复杂的算法算法不一定就能得到一个很好的结果,可能简单的算法反而能得到想要的结果。
-3-
文档评论(0)