- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第十九章大数据架构设计理论与实践知识点精讲(二)系统架构设计师第二版
综合知识精讲培训课讲师:邵宗其
考点分析本章主要学习大数据方向软件架构的发展和工作中的实践。根据考试大纲,本小时知识点会涉及案例分析题和论文题(各占25分)。本小时内容侧重于理解性记忆,按照以往的出题规律,部分基础知识点来源于教材,部分考查内容需要灵活运用相关知识点。知识架构如图所示。大数据架构设计理论与实践
【基础知识点】1.大规模视频网络某网采用以Lambda架构搭建的大数据平台处理里约奥运会大规模视频网络观看数据,具体平台架构设计如图22.6所示对于图22.6中的数据计算层可以分为离线计算、实时计算、合并计算3个部分。(1)离线计算部分:用于存储持续增长的批量离线数据,并且会周期性地使用Spark和Map/Reduce进行批处理,将批处理结果更新到批视图之后使用Impala或者Hive建立数据仓库,将结果写入HDFS中。(2)实时计算部分:采用SparkStreaming,只处理实时增量数据,将处理后的结果更新到实时视图。(3)合并计算部分:合并批视图和实时视图中的结果,生成最终数据集,将最终数据集写入HBase数据库中用于响应用户的查询请求。大数据架构设计理论与实践
【基础知识点】2.广告平台某网基于Lambda架构的广告平台,分为批处理层(BatchLayer)、加速层(SpeedLayer)、服务层(ServingLayer),如图22.7所示。(1)批处理层:每天凌晨将Kafka?中浏览、下单等消息同步到HDFS?中,将HDFS?中数据解?析为Hive?表,然后使用HQL?或Spark??SQL?计算分区统计结果Hive?表,将Hive?表转储到MySQL?中作为批视图。大数据架构设计理论与实践(2)加速层:?使用Spark?Streaming?实时监听Kafka?下单、付款等消息,?计算每个追踪链接维?度的实时数据,?将实时计算结果存储在Redis?中作为实时视图。(3)服务层:?采用Java?Web?服务,对外提供HTTP?接口,Java?Web?服务读取MySQL?批视图?表和Redis?实时视图表。
3.公司智能决策大数据系统某证券公司智能决策大数据系统是一个基于Kappa架构的实时日志分析平台,如图22.8所示。具体的实时处理过程如下:(1)日志采集:用统一的数据处理引擎Filebeat实时采集日志并推送给Kafka缓存。(2)日志清洗解析:?利用基于大数据计算集群的?Flink?计算框架实时读取?Kafka?消息并进行?清洗,解析日志文本转换成指标。大数据架构设计理论与实践(3)日志存储:日志转储到ElasticSearch?日志库,指标转储到OpenTSDB?指标库。?(4)日志监控:单独设置告警消息队列,?保持监控消息时序管理和实时推送。
4.电商智能决策大数据系统该智能决策大数据平台基于Kappa架构,使用统一的数据处理引擎Funk可实时处理流数据,并将其存储到数据仓库工具Hive与分布式缓存Tair中,以供后续决策服务的使用。如图22.9所示。送给?Kafka缓存。(2)数据清洗聚合:由?Flink?实时读取?Kafka?消息,?按需过滤参与业务需求的指标,将聚合?时间段的数据转换成指标。实时处理的过程如下:(1)?数据采集:?B?端实时采集用户点击、下单、广告曝光、出价等数据然后推大数据架构设计理论与实践(3)数据存储:?Flink?将计算结果转储至Hive??日志库,将模型需要的参数转储至实时计算数?据库Tair?缓存,然后后续决策服务从Tair?中获取数据进行模型训练。
谢谢欣赏THANKYOU
您可能关注的文档
- 第1讲大数据架构设计理论与实践传统数据处理系统存在的问题.pptx
- 第4讲大数据架构设计理论与实践Lambda 架构的实现.pptx
- 第5讲大数据架构设计理论与实践Kappa 架构介绍.pptx
- 第6讲大数据架构设计理论与实践Kappa 架构的实现和优缺点.pptx
- 第7讲大数据架构设计理论与实践Lambda 架构与Kappa 架构的对比和设计选择.pptx
- 第8讲大数据架构设计理论与实践大数据架构设计案例分析一.pptx
- 第9讲大数据架构设计理论与实践大数据架构设计案例分析二.pptx
- 第14讲大数据架构设计理论与实践知识点精讲一.pptx
- 2024—2025学年内蒙古自治区兴安盟科尔沁右翼前旗第二中学高二上学期12月月考英语试卷.doc
- 水库建设实施方案.docx
- 2024—2025学年青海省西宁市海湖中学高一上学期第二次阶段测试英语试卷.doc
- 低空经济促进区域经济一体化发展.docx
- 六年级科学下册第四单元信息单元学习回顾素材教科版.doc
- 光伏电站建设可行性研究.docx
- 浙江省诸暨市2024_2025学年高二历史上学期期末考试试题.doc
- 宁夏银川一中2024_2025学年高二地理上学期期末考试试题.doc
- 环保产业未来发展趋势与对策.docx
- 浙江诗诚联盟2024届高三语文适应性考试试题含解析.doc
- 2024—2025学年三省G20示范高中高三上学期12月联考英语试卷.doc
- 2024—2025学年辽宁省凌源市联考高一上学期期末考试英语试卷.doc
最近下载
- 2025年全国特种设备安全管理人员A证考试题库(含答案) .docx
- 灌装操作工作业指导书.doc
- 番茄酱灭菌灌装机说明书end.doc VIP
- 性格培养08勇敢的小熊.pptx
- 腐植酸肥料生产建设项目可行性研究报告.doc
- 民营企业财务管理新规制度.doc
- 2023基于手机银行APP专区调研的客群精细化运营分析报告.pdf VIP
- 杀菌操作工作业指导书.doc VIP
- 基于手机银行APP专区调研的客群精细化运营分析报告-42页.doc VIP
- 马工程系列《教育学原理》项贤明主编第一到十章全完整版课件PPT:产生发展、教育与社会人的发展、目的培养目标、制度、课程教学德育、教师学生等(1).pptx
文档评论(0)