数据门户产品建设研究.docxVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

?

?

数据门户产品建设研究

?

?

王丹丹张璐明贺小刚刘鹏

【摘要】??在我国经济高速发展的今天,我国经济建设推动信息化产业高速运行,目前已经渗透进我国各行各业的生产活动中,人们日常生活也离不开信息化产品。在这种背景下,大数据平台也成为科学技术重要角色。本文针对数据门户产品进行分析,并对数据门户产品建设作出研究,促进企业等机构利用数据化产品,旨在提高企业工作效率与质量,为我国经济健康发展提供奠定基础。

【关键词】??数据产品??大数据平台??成果展示

引言:

我国正在大跨步走向信息化时代,社会对于信息产品需求也逐渐提高。而以基础框架与各类模块数据门户产品,因为其适用性较强,所以被企业、社会广泛使用。还可以根据用户需求制定不同模块内容,受到用户一致好评。所以,将数据门户产品详细剖析,分析其基本原理与内容结构,并采用适当方法对其进行建设,可以有效提高企业核心竞争力,提高我国整体科技水平。

一、数据门户产品的相关概述

1.1内存计算产品

内存计算产品(In-MemoryComputing),准确分析是作为一种技术构架存在,但是为内存计算技术提供信息处理的平台却具有大数据特性,可以认为其是数据门户产品中一类。

例如Spark,基于hadoop分布式文件存储数据,将数据存储工作交给HDFS,专注与信息处理环节。以数据计算为主要内容,提供交叉查询与负载优化等功能。目前使用Spark内存计算技术为Databricks云,主要负责大数据处理相关工作,高效发挥Spark计算能力,为常见工作内容优化流程提供必要初始程序[1]。

而HANA为用户提供内存计算相关引擎,同时提供基于HANA的建模工具,可以从SAP公司商务配套软件或产品中直接导入第三方数据内容,数据信息处理后,可以将其传送到SAPBI客户端进行完整重现,降低客户数据处理所需时间,有效提高数据处理工作质量。其他内存计算产品也是以高速信息处理,准确数据分析为主要发展方向,提供海量数据存储条件,增加用户黏性。

1.2hadoop发行版

利用分布式计算机MapReduce,HBase数据库,Hive引擎构建的hadoop生态系统,现已成为目前主要数据应用技术体系。包括华为,IBM等互联网与IT厂商,都加入hadoop生态圈,并推出各家企业商用hadoop发行版本,在对hadoop开源社区兼容性,应用安全性等都具有不同特色,可以实现批量处理信息数据,部分企业还在实时数据信息处理有较强建树[2]。

作为目前应用最为广泛、最典型大数据处理平台,不仅可以实现对海量数据高速处理,安全存储,也可以实现高效管理与监控复杂集群。而hadoop发行版的部分内容因为性能优秀,在实际应用中表现良好性质,也被hadoop开源社区吸收采纳,增加hadoop生态系统完善性与多样性,对后续企业使用提供便利性。

1.3大数据平台及产品分析

开源hadoop系统在开发环节存在自身携带问题,无法满足企业商业应用需求,例如在图形管理工具方面欠缺,会对工作效率大幅度降低。而hadoop发行版不仅与开源hadoop系统具有较高兼容性,也可以根据企业需求增添管理与应用模块,对开源hadoop方案进行优化升级,进行合理改造;Spark擁有实时查询功能,在流计算方面变现良好。而hadoop的核心内容,分布式计算架构MapReduce可以对海量数据进行批量式计算。

在Spark日益成熟,行业许多hadoop发行版都会将Spark融入其中,未来两者极有可能走向相互融合。相较于基于RDBS关系构建数据库,一体化平台无论是性能、可拓展性等方面都有较大突破。而在以往SQL接口支持、ET/BI上下游软件兼容性等薄弱方面,经过近些年发展,部分核心内容已经得到有效突破,拥有良好进展情况。而我国地域辽阔,人口众多,每天会产生海量数据信息,实时交流软件腾讯,购物平台阿里,信息发布平台微博等,都开始将技术研发专项大数据处理方面,未来中国大数据平台与产品领域将是科技发展主要方向。

二、数据门户产品建设研究

2.1基本概念与参考的模型

根据维基百科定义,大数据即无法使用常规工具,在可接受时间范围内,有效进行捕获处理的数据集合形式。在科技逐渐发展的现在,大数据则被描述为无法使用传统数据处理产品处理的海量数据。

大数据技术并不仅限于可以迅速掌握庞大数据信息内容,重点为如何对数据在短时间内进行有效专业化处理。大数据类型分为结构化、半结构化与非结构化三种,目前全球多数企业处理信息数据多为半结构化数据,并且以每年60%速度稳定递增。

而数据门户产品就是基于大数据背景下,融合相关软件硬件,构成平台处理一体化功能系统产品。网络加速模块、数据存储单元共同构成大数据硬件基础设置,而分布式文件系统与其计算系统,内存数据库和大数据应用中间件构成

文档评论(0)

183****9213 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档