OracleBigDataDiscovery大数据发现-Hadoop的可视化界面-UAO.PDF

OracleBigDataDiscovery大数据发现-Hadoop的可视化界面-UAO.PDF

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
OracleBigDataDiscovery大数据发现-Hadoop的可视化界面-UAO

Oracle Big Data Discovery: 大数据发现 - Hadoop 的可视化界面 当今的大数据挑战不在于怎么存储,而是怎么弄清楚数据背后的含义。Oracle Big Data Discovery 是一种全新的大数据分析方法,有效地帮助组织 机构快速地看到和了解Hadoop 中原始数据的潜在意义,并且轻松转换数据使其更加直观用以信息发现,然后共享数据带来的新的价值,这一切, 都是在一个简单易用的可视化产品中实现。Oracle Big Data Discovery 为海量数据提供高速响应,驱动大数据分析帮助每个人发现数据中的新价值。 图1 Oracle Big Data Discovery 一款改变大数据发现游戏规则的产品 Hadoop 仍旧不断发展,各类组织越来越多的使用其存储大量的包含企业数据仓库及其以外的数据。而搜集和存储数据只是使用它来进行分析的第 一步,但是这一步对于大多数组织却是他们所做的唯一一件事。现有的分析方式通常不能适用于大数据,因为大数据就本质而言是全新的,尤其 是多样性、质量的差异性、不断变化以及很大程度上的陌生性。这就使得各类公司面对艰难的选择:重金聘请能够使用复杂和非集成工具并能够 发现大数据意义的高级专业人才;或者将一系列新出现的点段解决方案艰难地拼凑到一起尝试获取数据整体视图和数据所能带来的价值。 现在非常明确需要的是一个对应大数据的整体方案,这能够使得组织机构简单、直观看到 Hadoop 中所搜集的数据,快速发觉其潜在价值;同时 在不需要切换工具的情况下图形化和动态地使用数据,通过交互式发现寻找数据,快速将数据可视化并在同事间共享,帮助企业和机构更多的利 用他们的分析能力驱动创新。 Oracle Big Data Discovery 的设计强调这类需求,使大数据在组织内部对于每个人都能够更加容易地使用,又可以降低当前与大数据项目相关的风 险,缩短投资回报周期。 发现大数据中的潜在价值 不了解回报概念的情况下论证投资是很困难的, 不知道数据中的意义评估其潜在价值也是非常困难的。Oracle Big Data Discovery 通过实现快速地 可视化访问Hadoop 中数据的来解决此类问题,所以企业和组织能够:  在Hadoop 中,通过丰富的原始数据交互目录快速寻找相关数据;  通过自助向导加载本地Excel 和CSV 文件数据  查看数据集描述,其他用户的注释以及相关数据集的推荐  通过用户熟悉的查找和指导性导航方式探索数据 图2 Big Data Discovery 的交互目录 通过综合各个数据集中的属性统计信息,用户看到了数据的形态,快速了解数据质量并发现数据异常,最终评估出数据的潜在价值。这能够确保 企业和组织:  以数据类型可视化每个数据属性,轻松看清哪些是最相关的数据  以潜在价值排序属性,最有意义的信息会显示在最前面  使用工作面板发掘属性间的潜在模式和相关性 图3 用Oracle Big Data Discovery 探索数据 快速优化大数据 不管范围多大,分析数据的其中一个挑战在于很少有数据可以直接使用,总是需要不同程度的清理和转化。获取更好的数据分析价值意味着要深 层次拓展数据,抽取主题和情感,并且混合数据集来展示新的模式。在现今的大数据环境下,转换和丰富数据经常需要预处理并且使用不同的工 具实现,这样会改变上下文和并增加实现有意义结果的时间。 图4 使用Oracle Big Data Discovery 转换数据 Big Data Discovery 并非如此。数据转换和丰富功能天然集成在产品中,显示在一个直观的、交互的可视化界面里,这在后台利用了Apache Spark 的功能,高性能地转化大量数据,并保证上下文内容不失真。包括从数据科学家到商务分析人员的用户能够:  在Hadoop 中,通过一个直观的、类似Excel 模式的界面探讨数据  利用常用数据转换的拓展库,分离、合并、分类和替代数据,以及更多的功能  丰富和引申语言含义或者从地理信息字段生成地图层次,同时自动从原始文本抽取感情和主题  在Hadoop 中全面应用数据转换之前,先在内存中的样本数据上测试转换  在全面提交数据转换之前,可预览结果,取消或者重复数据转化 让每个人都能轻松使用Big Data Discovery 重要的是,Big Data Discovery 给业务分析员以及数据科学家实现了整个发现过程,允许大数据团队中

您可能关注的文档

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档