网站大量收购独家精品文档,联系QQ:2885784924

数据挖掘实验报告3.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘实验报告3

课内实验报告 课 程 名: 数据仓库与数据挖掘 任课教师: 朱恒民 专 业: 电子商务 学 号: 二○一五 至二○一六 年度 第2 学期 南京邮电大学 管理学院 《 数据仓库与数据挖掘 》课程实验第 3 次实验报告 实验内容及基本要求: 实验项目名称:分类挖掘任务的实践 实验类型: 综合型 每组人数: 1 实验内容及要求: 运用数据挖掘中的经典分类算法——ID3完成贷款审批分析和电信客户流失分析,并运用一元线性回归分析模型对黄瓜的销量进行预测。 实验结果: 实验一分类挖掘在贷款审批中的应用 数据选择:按住“读Excel文件”图标,将其拉入右侧的“工作簿”—— 选择工作簿为“Credit Screening”——设置缺省列类型为“Category”——点击“更新预览”按钮,查看是否能够读取出数据——运行“读Excel文件”图标。 创建分类模型:按住“分类型决策树”图标,将其拉入右侧的“工作簿”并将其与“读取Excel文件”连接起来——选择分类的目标属性:本实验中设置“因变量列”为列“Granted”——选择决策属性:本实验中将所剩下的“可用列”设置为“自变量列”,其他属性采用默认设置——运行“分类型决策树”图标。 应用模型预测:按住“预测”图标,将其拉入右侧的“工作簿”)中,并将其与“分类型决策树”连接起来——同时将其与一待预测的数据文件(可将预测的数据保存至Excel文件,如predict.xls,然后按步骤2所示方法进行设置)连接起来——再后右击“预测”图标,选择“运行至此”。 结果输出:按住“写文本文件”图标,将其拉入右侧的“工作簿”中,并将其与“预测”连接起来——在“属性”页面,点击“浏览”,选择输出文本文件保存的路径——在“文件名”文本框中,点击浏览选择输出文件路径,然后再键入result.txt。在“分隔符”列表框中选择tab delimited。点击“确定”。——运行该步骤即可。 规律: 工龄大于两年半,贷款用于购买电脑、珠宝或家具,可以提供贷款; 工龄大于两年半,贷款不用于用于购买电脑、珠宝或家具,性别为男性,可以提供贷款; 工龄大于五年半,贷款不用于用于购买电脑、珠宝或家具,性别为女性,可以提供贷款; 工龄小于两年半,贷款不用于买电脑或学费支出,而是贷款用于购买汽车或珠宝,不在问题区域,年龄在20.50(包含)与56.00之间,可以提供贷款; 工龄小于两年半,贷款不用于购买电脑或学费支出,不在问题区域,不能提供贷款。 实验二分类挖掘在电信客户流失中的应用 规律: 收入小于186.5,客户会流失;收入大于433.5,客户也会流失。所以客户收入与客户是否流失并无明显影响;发现在相同收入区间内,是否免费对流失与否影响巨大。综上所述,在一定程度上,我们可以认为客户收入变化并不影响客户忠诚度,是否免费是左右客户选择的重要因素。 实验三回归分析 文件读入 线性回归 预测 结论: 上图可得,回归方程: Y = 210.44 - 157.78X。 R-Square=0.89,表明黄瓜价格与重量之间的线性关系所解释的比例为89%,说明两者之间有较强的线性关系。 线性关系的检验Pr(F)=4.34E-6,表明回归方程的线性关系特别显著。 回归系数的检验Pr(|t|)=1.21E-8,表明回归系数特别显著。 成绩评定: 该生对待本次实验的态度 □认真 □良好 □一般 □比较差。 本次实验的过程情况 □很好 □较好 □一般 □比较差 对实验结果的分析 □很好 □良好 □一般 □比较差 文档书写符合规范程度 □很好 □良好 □一般 □比较差 综合意见: 成绩 指导教师签名 朱恒民 日期

文档评论(0)

yaobanwd + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档