Weka数据挖掘软件使用指南.pdf

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

分享高质量文档

Weka数据挖掘软件使用指南

Weka数据挖掘软件使用指南

1.Weka简介

该软件是WEKA的全名是怀卡托智能分析环境(Waikato

EnvironmentforKnowledgeAnalysis),它的源代码可通过得到。Weka作

为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器

学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在

新的交互式界面上的可视化。如果想自己实现数据挖掘算法的话,可以看

一看Weka的接口文档。在Weka中集成自己的算法甚至借鉴它的方法自

己实现可视化工具并不是件很困难的事情。

2.Weka启动

打开Weka主界面后会出现一个对话框,如图:

主要使用右方的四个模块,说明如下:

Explorer使用Weka探索数据的环境,包括获取关联项,分类预测,

簇等;(本文主要总结这个部分的使用)

Experimenter运行算法试验、管理算法方案之间的统计检验的环境;

KnowledgeFlow这个环境本质上和Explorer所支持的功能是一样的,但是

它有一个可以拖放的界面。它有一个优势,就是支持增量学习;

SimpleCLI提供了一个简单的命令行界面,从而可以在没有自带命令行的

操作系统中直接执行Weka命令;(某些情况下使用命令行功能更好一

分享高质量文档

分享高质量文档

些)

3.主要操作说明

点击进入Explorer模块开始数据探索环境:

3.1主界面

进入Explorer模式后的主界面如下:

3.1.1标签栏

主界面最左上角(标题栏下方)的是标签栏,分为五个部分,功能依

次是:

1.Preprocess.选择和修改要处理的数据;

2.Classify.训练和测试关于分类或回归的学习方案;

3.Cluster.从数据中学习聚类;

4.Associate.从数据中学习关联规则;

5.Selectattributes.选择数据中最相关的属性;

6.Visualize.查看数据的交互式二维图像。

3.1.2载入、编辑数据

标签栏下方是载入数据栏,功能如下:

1.Openfile.打开一个对话框,允许你浏览本地文件系统上的数据文件

(.dat);

2.OpenURL.请求一个存有数据的URL地址;

3.OpenDB.从数据库中读取数据;

4.Generate.从一些数据生成器中生成人造数据。

3.1.3其他界面说明

分享高质量文档

分享高质量文档

接下来的主界面中依次是Filter(筛选器),Currtentrelation(当前关

系)、Attributes(属性信息)、Selectedattribute(选中的属性信息)以及

Class(类信息),分别介绍如下:

Filter

在预处理阶段,可以定义筛选器来以各种方式对数据进行变换。Filter

一栏用于对各种筛选器进行必要设置。Filter一栏的左边是一个

Choose按钮。点击这个按钮就可选择Weka中的某个筛选器。用鼠

标左键点击这个choose左边的显示框,将出现GenericObjectEditor对话

框。用鼠标右键点击将出现一个菜单,你可从中选择,要么在

GenericObjectEditor对话框中显示相关属性,要么将当前的设置字符

复制到剪贴板。

Currtentrelation

显示当前打开的数据文件的基本信息:Relation(关系名),Instances

(实例数)以及Attributes(属性个数)。

Attributes

显示数据文件中的属性信息,并且包含四个操作按键:

1.All.所有

文档评论(0)

189****1877 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体天津卓蹊信息咨询有限公司
IP属地辽宁
统一社会信用代码/组织机构代码
91120102MADL1U0A9W

1亿VIP精品文档

相关文档