数据挖掘29695.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
昆明理工大学信息工程与自动化学院学生实验报告 ( 2011 —2012 学年第 1 学期 ) 课程名称:数据仓库与数据挖掘 开课实验室: 信自楼445 2011年 12月 7日 年级、专业、班 计科081 学号 200810405130 姓名 孙永星 成绩 实验项目名称 数据挖掘 指导教师 周海河 教师评语 提前预习实验内容、自觉遵守考勤和规章、按时参加实验和交付实验报告(30分)。 二、检查实验数据、数据记录、完整正确(10分)。 三、技术路线图、数据表格、公式、特性曲线、波形绘制符合规范要求(10分)。 四、报告基本内容(包括实验目的、实验原理、实验技术路线、实验条件、实验方法步骤、实验数据及处理)完整(10分)。 五、独立完成实验、有实验分析和总结(10分)。 六、报告书写工整、条理清楚、概念正确、逻辑性强、语言流畅(10分)。 七、现场实验操作技能熟练(10分)。 八、有个人的见解或创新(10分)。 教师签名: 年 月 日 一、实验目的 1.理解数据挖掘的基本概念及其过程; 2.理解数据挖掘与数据仓库、OLAP之间的关系; 3.理解基本的数据挖掘技术与方法的工作原理与过程,掌握数据挖掘相关工具的使用。 二、实验原理及基本技术路线图(方框原理图) 将创建一个数据挖掘模型以训练销售数据,并使用“Microsoft 决策树”算法在客户群中找出会员卡选择模式。请将要挖掘的维度(事例维度)设置为客户,再将 Member_Card 成员的属性设置为数据挖掘算法识别模式时要使用的信息。然后选择人口统计特征列表,算法将从中确定模式:婚姻状况、年收入、在家子女数和教育程度。下一步需要训练模型,以便能够浏览树视图并从中读取模式。市场部将根据这些模式设计新的会员卡,使其适应申请各类会员卡的客户类型。 三、上机平台、环境 操作系统:Windows 7 数据库:SQLServer2008 四、实验方法、步骤 新建数据表:大理PAS流失训练 CREATE TABLE [dbo].[大理PAS流失训练]( [SERV_ID] [float] NULL, [CUST_ID] [float] NULL, [ZWSC] [float] NULL, [BILLING_MODE_ID] [float] NULL, [PAYMENT_METHOD] [float] NULL, [ORG_ID] [float] NULL, [NEW_YXSX] [float] NULL, [ZWSC_DSC] [nvarchar](255) NULL, [KB] [nvarchar](255) NULL, [AGE] [nvarchar](255) NULL, [LX] [nvarchar](255) NULL, [CL] [nvarchar](255) NULL, [FEE_ALL] [nvarchar](255) NULL, [YC] [nvarchar](255) NULL, [IS_LS] [float] NULL ) ON [PRIMARY] 导入数据 在数据源视图中添加“大理PAS流失训练”表 使用新建数据挖掘向导创建数据挖掘结构 使用决策树算法 指定输入列和可预测列以及键 指定列的内容和数据类型 创建测试集 指定测试数据百分比为50% 指定数据挖掘的名称 处理并得到预测值和实际值的对比矩阵 查看挖掘结构 查看挖掘模型 挖掘模型查看器 六、实验结果分析、经验总结或结论(例如对实验获取数据的误差分析、数据处理、成果等。其中,绘制曲线图时必须用标准计算纸,不得随意用普通白纸绘画) 复杂的算法算法不一定就能得到一个很好的结果,可能简单的算法反而能得到想要的结果。 -3-

文档评论(0)

sxty + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档