饿了么大数据平台的工具链、技术选型及架构设计.pdf

饿了么大数据平台的工具链、技术选型及架构设计.pdf

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
饿了么大数据平台的工具链、技术选型及架构设计

饿了么大数据平台建设 主讲人:毕洪宇 时间:2017.06.11 About me 毕洪宇 eBay/PPTV Database Engineer VIPSHOP Staff Database/Big Data Engineer 饿了么 Big Data Platform Director Agenda 大数据平台现状 面临的挑战 技术选型 架构设计 稳定性 工具链 平台的一些想法 大数据平台现状 美好生活触手可得 2015年5月 团队成立 9年 2年 Make everything 30min 美好生活触手可得 • 离线计算 增量(不考虑副本) 100TB/day 集群规模 100-1000 nodes ,X10 expanding 表数据 90K表 400报表 调度任务 20K 任务数 80K mapreduce/spark 计算数据吞吐 3PB/day 美好生活触手可得 • 实时计算 集群规模 kafka 50+ Topology 10-100+ nodes 1M+records/s 8+ GB/s ,2M+ records/s 美好生活触手可得 • 逻 辑 架 构 与 数 据 流 向 面临的挑战 美好生活触手可得 人少活多 积累不足 内在质量差不多就行 应对套路 千人千面 Fire and Forget 美好生活触手可得 效率 质量 持续扩展 技术选型 美好生活触手可得 美好生活触手可得 团队 3T Trouble :解决什么问题 Team Tech :哪些合适的技术,生态和 社区的状态 技术 场景 Tech Trouble Team :熟悉程度学习成本 使用 成本 运维成本 美好生活触手可得 • Presto VS Hive VS Spark SQL 场景 海量数据 Ad-hoc查询 团队 Presto略熟 技术 社区方面 Spark 稳定性 Presto 使用成本 Spark SQL 美好生活触手可得 • HB

文档评论(0)

seunk + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档