weka简介.pptVIP

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
weka简介ppt课件

WEKA简介 一、简介 WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/ml/weka得到。同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。 WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。 如果想自己实现数据挖掘算法的话,可以看一看weka的接口文档。在weka中集成自己的算法甚至借鉴它的方法自己实现可视化工具并不是件很困难的事情。 2005年8月,在第11届ACM SIGKDD国际会议上,怀卡托大学的Weka小组荣获了数据挖掘和知识探索领域的最高服务奖,Weka系统得到了广泛的认可,被誉为数据挖掘和机器学习历史上的里程碑,是现今最完备的数据挖掘工具之一。Weka的每月下载次数已超过万次。 二、启动WEKA Explorer 使用 WEKA 探索数据的环境。(本文档的其它部分将详细介绍这个环境) Experimenter 运行算法试验、管理算法方案之间的统计检验的环境。 KnowledgeFlow 这个环境本质上和 Explorer 所支持的功能是一样的,但是它有一个可以拖放的 界 面。 它有 一 个优 势, 就 是支 持增 量 学 习(incremental learning)。 SimpleCLI 提供了一个简单的命令行界面,从而可以在没有自带命令行的操作系统中直接执行 WEKA 命令。 三. WEKA Explorer 3.1 标签页 在窗口的顶部,标题栏下是一排标签。当 Explorer 首次启动时,只有第一个标签页 是活动的;其他均是灰色的。这是因为在探索数据之前,必须先打开一个数据集(可能还要对它进行预处理)。 所有的标签页如下所示: 1. Preprocess. 选择和修改要处理的数据。 2. Classify. 训练和测试关于分类或回归的学习方案。 3. Cluster. 从数据中学习聚类。 4. Associate. 从数据中学习关联规则。 5. Select attributes. 选择数据中最相关的属性。 6. Visualize. 查看数据的交互式二维图像。 这些标签被激活后,点击它们可以在不同的标签页面上进行切换,而每一个页面上可以 执行对应的操作。不管位于哪个页面,窗口的底部区域(包括状态栏、log 按钮和 Weka 鸟) 仍然可见。 3.2 状态栏 状态(Status)栏出现在窗口的最底部。它显示一些信息让你知道正在做什么。例如,如果 Explorer 正忙于装载一个文件,状态栏就会有通知。 提示 — 在状态栏中的任意位置右击鼠标将会出现一个小菜单。这个菜单给了你两个选项: 1. Memory Information. 在 log 栏中显示 WEKA 可用的内存量。 2. Run garbage collector. 强制运行 Java 垃圾回收器,有哪些信誉好的足球投注网站不再需要的内存空间并将之释放,从而可为新任务分配更多的内存。注意即使不强制运行,垃圾回收也是一直作为后台任务在运行的。 3.3 Log 按钮 点击这个按钮,会出现一个单独的窗口,包含一个可拖动的文本区域。文本的每一行被加了一个时间戳,显示了它进入日志(log)的时间,一旦在WEKA 中执行某种操作时,该日志就会记录发生了什么。对于使用命令行或者 SimpleCLI 的人,日志也将完整地记录分类,聚类,特征提取等任务的设置字符,使得它们可被复制/粘贴到其它地方。但关于数据集和 class 属性 1的选项仍然要由用户给出(例如,分类器(classifier)的 –t,或者筛选器的 –i 和 -o) 3.4 WEKA 状态图标 状态栏的右边是 WEKA 状态图标。当不运行任何进程时,WEKA鸟会坐下并打一个小盹。×符号旁的数字显示了正运行的并发进程的数量。当系统空闲时,它是零,而当进程的数量增长时,它也会增长。任意进程启动后,小鸟会站起来并到处活动。如果它仍然是站着的,但是很长时间内不动,那么它生病了:某个地方出错了!在这种情况下,应该重新启动 WEKA Explorer。 3.5预处理 3.5.1 载入数据 预处理页顶部的前4个按钮用

文档评论(0)

118zhuanqian + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档