- 1、本文档共64页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Hadoop构建数据仓库平台
Hive1.0 架构 Hadoop2.0 和平台化 Hive2.0 平台化架构 思考 使用方法 add FILE db_mapper.py; SELECT TRANSFORM [](ip,port, user, passwd) USING python db_mapper.py movie_db AS (userid, movieid, rating, weekday) FROM u_data; [需求] -- [展现] -- [分析逻辑] -- [数据结构] 变化可能 ----- 越到底层越少 修改成本 ----- 越到底层越高 [数据 构建思路 ] [抽象分析] -- [总结归纳] -- [数据结构] -- [各类逻辑] -- [业务需求] 保留全部可能性 -- 总结需求的组成基本变量 -- 总结固定逻辑和结构 -- 设计满足各类需求的系统 1. 数据公式:[4w+r = 2h] 2. 实时汇总:[js--nginx+perl-- syslog-ng/scribe -- Hadoop/Hive -- ETL -- db] 3. 存储格式:[一日一表,一日一分区] 4. 统计方法:[2sql 方法] 5. 图表展现:[模板引擎] 1. 外部表 一日一个表结构 (一日一表,一日一分区) 2. 表结构 [Log txt] 3. 无需索引 4. 使用LZO压缩工具 压缩率 3/1 5. 举例: search_logclick_logRedHadoop 管理界面 视频图像处理流程(Video MapReduce) V-MapReduce-人脸识别效果截图 平台规划 界面规划 功能改进 AppStore 功能进阶 将Ambari汉化,构建适合国内用户应用平台 构建易用、高效的Hadoop平台 打造以Hadoop为核心的,应用商店 为开发者提供Api和自动构建工具 专注于企业级大数据 我们的软件产品 企业级RedHadoop大数据自助 DAAS平台 RedHadoop基础平台 ETL工具 报表工具 调度系统 权限管理平台 基于Hbase+Hive+Phoenix 支持OLAP+OLTP的数据库 Hadoop平台 游戏 移动APP 网站 Amazon 阿里云(aliyun) 使用盛大云服务器 采用xshell工具登陆三台服务器 Centos6.2 64位 三台服务器有相同的登陆用户root及相同的登陆密码 内网ip为(使用 ifconfig 查询内网ip): 06 83 02 Linux 远程访问工具:Xshell、Xftp,或者(putty、flashfxp) RedHadoop安装流程 同步服务器时间: /usr/sbin/ntpdate 配置无密码连接 ssh-keygen chmod 600 .ssh/authorized_keyschmod 700 .ssh cat id_rsa.pub authorized_keys scp authorized_keys root@hostname:/root/.ssh/ 测试是否成功: ssh SNDA-172-17-14-183 .ssh/id_rsa .ssh/id_rsa.pub ambari-server setup (开始初始化) Customize user account for ambari-server daemon [y/n] Do you accept the Oracle Binary Code License Agreement [y/n] (y)? Enter advanced database configuration [y/n] (n)? 1 - PostgreSQL (Embedded)(默认1) 2 – Oracle Database Name (ambari): Username (ambari): Enter Database Password (bigdata): 7:8080 管理界面 专注于企业级大数据 提纲 数据开放,数据云服务平台(DAAS)时代 Hadoop平台在数据云平台(DAAS)上的天然优势 数据云平台(DAAS 平台)思想和组成部分 互联网公共数据大云(DAAS)案例 Hadoop构建构建游戏云(Web Game Daas)平台 专注于企业级大数据 数据分析师 ETL开发工程师 模型架构师 运营 程序员 数据化运营 商业决策 产品设计 理解业务 文档化业务和需求 BI产品设计 PD 业务分析师/数据PD 卖家 买家 数据产品PD 店铺经营 购买决策 行业分析 分析、挖掘用户需求 数据产品设计 数据模型建模 架构师 技术框架设计 平台与工具的实
您可能关注的文档
- DCS设计及组态准备.ppt
- DEFORM软件简介.ppt
- C章_气体击穿理论分析和气体间隙绝缘.ppt
- deltas空滤器().ppt
- DELL公司战略管理案例(PPT23)ppt.ppt
- DFT可测率分析软件VayoPro-TestExpert.ppt
- DCYX世联-龙奥天街202年营销执行报告.ppt
- DifferencesBetweenChineseandAmericanEducationSystem.ppt
- DL-型合成绝缘子检测仪.ppt
- DISC性格分析_演示版.ppt
- 中国国家标准 GB/T 18233.4-2024信息技术 用户建筑群通用布缆 第4部分:住宅.pdf
- GB/T 18233.4-2024信息技术 用户建筑群通用布缆 第4部分:住宅.pdf
- GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计.pdf
- 《GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计》.pdf
- 中国国家标准 GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计.pdf
- GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置.pdf
- 《GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置》.pdf
- 中国国家标准 GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置.pdf
- GB/T 17889.4-2024梯子 第4部分:铰链梯.pdf
- 《GB/T 17889.4-2024梯子 第4部分:铰链梯》.pdf
文档评论(0)