- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
BI平台选型讲解材料.pptx
开源BI平台选型
BI系统概述
主流开源BI系统
建议选择
Pentaho平台
Pentaho计划
BI系统介绍
BI(Business Intelligence)即商务智能,它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策。通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。
组成系统:由数据仓库(或数据集市)、ETL流程、联机分析处理 (OLAP) 、查询报表、数据分析、数据挖掘等部分组成。
中端BI,数据分析。高端BI,数据挖掘。低端:报表阶段。
BI系统介绍
BI系统概述
主流开源BI系统
建议选择
Pentaho平台
Pentaho计划
主流开源BI系统介绍
开源BI
特点
量级
架构
大数据支持
中文
Openi
基于Java开发的Web应用,能对关系数据库和数据挖掘服务器进行分析和报表展示,非常易于使用和部署;但目前已经不在发布单独版本,而是和pentaho集成,为其提供plugin
轻
使用Mondrian和Jpivot框架,报表引擎是jasper report,数据挖掘接口是R-Project,
相对来说开发和学习比较简单
无
不
Bizgres
卓越的数据处理性能, 但目前已经没有维护了
Pentaho
以工作流为核心的、强调面向解决方案而非工具组件的BI套件,Pentaho偏向于与业务流程相结合的BI解决方案,侧重于大中型企业应用。相对spagoBi来说功能较强,尤其是工作流一块做的相当不错。相关文档比较全
重
比较大的框架了,集成了相当多的开源项目,JfreeReport、Mondrian、Kettle、Weka基本都使用了。特别适合大型复杂项目的开发
支持hbase,
mapreduce
支持
SpagoBI
使用java开发,有很强的扩展能力,相关文档较少。
重
Talend for ETL,JasperReports
无
支持
jasper
jasper report的支持最好,所以报表部分比较好,其它部分较弱
轻
使用Talend作为ETL
BI系统概述
主流开源BI系统
建议选择
Pentaho平台
Pentaho计划
建议选择
基于以上的对比分析,建议选用pentaho作为我们的BI平台。
优点:
成熟稳定性:pentaho社区版目前还不断更新中, 目前必威体育精装版版本5.2
文档完备性:pentaho社区版的官方文档较完备,中文文档也较多。
中文支持:报表支持中文。
可扩展性:pentaho集成了很多优秀的开源组件,它集成了很多优秀的开源组件,如Weka做数据挖掘,Kettle做ETL工具,JfreeReport报表组件。
支持大数据接入,如Hbase, mapreduce.
劣势:
重量级平台,它包含的组件很多,体系很庞大,学习掌握需要时间。
虽然中文文档相对于其他开源平台为多,但多是老版本的,必威体育精装版版本的文档只有英文。
Pentaho介绍
Pentaho介绍
是一个统一,综合的开源商务智能平台套件(Suite),基于它,可以访问,集成,操作,可视化,分析各种数据来源,帮助你从数据中发现所需要的知识,有收费的EE版本和开源的CE版本。目前CE必威体育精装版为5.2
采用的开源组件:
OLAP : Mondrian
数据挖掘:WEKA
报表:JFreeReport
ETL:kettle
分为2大系统:
Business Analytics: BA组件,主要是可视化,报表,侧重于业务和展示。
Data Integration: DI组件, ETL工具等,侧重数据模型和转换。
Pentaho介绍(BA)
1个核心server:
BA Server和user console:web界面用来管理用户创建的报表内容和业务逻辑,
4个web based Designer工具
Report Designer: 报表设计器
Analyzer: 过滤和可视化数据
Interactive Reports: 交互性报表环境
Dashboard Designer:设计dashboard
3个client based Designer工具:
Aggregation Designer:从不同维度创建聚合表
Metadata Editor:创建metadata domain和model
Schema workbench:创建和编辑多维模型,为模型增加安全和计算
Pentaho介绍(DI)
1个server:
DI Server: 使用DI engine来做数据转换和基础
4个Designer工具
Spoon: 定义job和转换的建模工具,转换:定义了数据的flow, job:包含了资源获取,执行其他转换。
Kitchen: 执行
文档评论(0)