- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘操作手册
数据挖掘操作手册
一、平台界面
1.数据挖掘应用概览页面
登录 ETHINK 平台后,您可以对数据挖掘应用进行新增和编辑。
2.数据挖掘应用设计器页面
当您进入到数据挖掘设计器页面后,您可以根据系统提供的各种编辑
工作,管理数据挖掘和各个组件。
二、数据挖掘步骤
1、定义问题
该步骤包括分析业务需求,定义问题的范围,定义计算模型所使用的
度量,以及定义数据挖掘项目的特定目标。
2、准备数据
数据可以分散在公司的各个部门并以不同的格式存储。
数据清除不仅仅是删除错误数据或插入缺失值,还包括查找数据中的
隐含相关性、标识最准确的数据源并确定哪些列最适合用于分析。
3、浏览数据
浏览技术包括计算最小值和最大值,计算平均偏差和标准偏差,以及
查看数据的分布。
4、生成模型
通过创建挖掘结构定义要使用的数据列。将挖掘结构链接到数据源,
但只有对挖掘结构进行处理后,该结构才会实际包含数据。
5、浏览和验证模型
在将模型部署到生产环境之前,您需要测试模型的性能。此外,在生
成模型时,您通常需要使用不同配置创建多个模型,并对所有这些模
型进行测试,以便查看哪个模型为您的问题和数据生成最佳结果。
三、快速入门
登录 ETHINK 平台,单击添加-挖掘平台。
1.添加分析数据
在左侧组件区数据一栏中 ,拖拽数据输入并配置数据至工作区。
2.对数据进行清洗
在左侧组件区清洗一栏中,拖拽数据筛选并配置字段。
3.为数据添加执行算法
在左侧组件区算法一栏中,拖拽数据算法并配置列和类型。
4.为数据添加评估模型
在左侧组件区评估一栏中,拖拽模型并配置评估方法。
5.为数据添加输出方式
在左侧组件区评估一栏中,拖拽模型并配置评估方法。
6.保存并运行应用。
可以在运行界面查看相关信息,包括流程图,节点信息,运行日志等。
点击查看,查看详细数据。
文档评论(0)