数据挖掘WEKA实验报告2.docx

下载文档

17
0
约小于1千字
约 7页
2016-11-06 发布于重庆
举报
版权申诉
保障服务

数据挖掘WEKA实验报告2.docx

1、本文档共7页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

数据挖掘WEKA实验报告2

数据挖掘-WEKA实验报告二姓名及学号：杨班级：卓越计科1301 指导老师：吴珏老师一、实验内容1、分类算法：（掌握weka中分类算法的使用）1）掌握决策树分类算法（C4.5，CART算法）2）打开数据集weahter.nominal.arrf，使用C4.5分类器（C4.5算法在Weka中是作为一个分类器来实现的，名称为J48）构建决策树。3）对结果进行分析。4）使用贝叶斯网络编辑器编辑贝叶斯网络。（选做）二、实验步骤(1)打开数据集weahter.nominal.arrf(2)采用J48构建决策树J48的结果J48的在窗口的可视化：J48的决策树可视化结果：(3)采用FilterClassifier构建决策树FilterClassifier的数据结果(4)使用贝叶斯贝叶斯的可视化结果：思考与分析使用FilterClassifier和J48，并采用有监督的二元离散化，与只使用J48处理原始数据的结果想比较。为何从离散化后的数据构建决策树，比直接从原始数据构建决策树，有更好的预测效果？(1)算法需要，例如决策树，NativeBayes等算法本身不能直接使用连续型变量，连续型数据只有经过离散化处理后才能进入算法引擎。(2)离散化可以有效地克服数据中隐藏的缺陷，是模型更加稳定。(3)有利于对非线性数据关系进行诊断和描述：对连续型数据进行离散化后，自变量和目标变量之间的关系变得清晰化。