网站大量收购闲置独家精品文档,联系QQ:2885784924

大数据处理技术简介.pptx

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据处理技术;;大数据概念; 近年来,一种新的数据密集型应用已经得到了广泛的认同,这些应用的实例包括:网络监控、电信数据管理、Web应用、传感检测等等。在这种数据流模型中,数据以大量、快速、时变(可能是不可预知)的数据流持续到达,如何对海量瞬时流动数据建模并处理,产生了一些新的基础性研究问题。;大数据应用情景一(B2C、C2C与金融):淘宝、股票等即时交易数据;大数据应用情景三(社交网络):社交网络即时消息处理;大数据应用情景三(物联网数据流):传感网、物联???、智慧城市;大数据应用情景四(数据流过滤):互联网带宽增长;国内外相关研究;国内外相关研究;应用;第一类方法,Hadoop改造: [1] Yingyi Bu等在Hadoop MapReduce工作的基础上设计了HaLoop,主要克服了Hadoop进行迭代计算时需要设置收敛条件以及每次迭代均需要重新加载数据的缺点; [2] 伯克利大学的Tyson Condie等对Hadoop进行改进,设计了Hadoop Online Prototype (HOP)系统,支持连续查询、事件监测以及流处理等功能; [3] Facebook在SIGMOD’ 2011上发表了利用Hbase/Hadoop进行实时处理数据的论文,通过一些实时性改造,力图使hadoop批处理计算平台也具备实时计算的能力。 [4] Google在新一代内容索引系统中放弃了MapReduce,替代者是尚不为人知的分布式数据处理系统Percolator,Percolator是一种增量处理平台,它能持续更新索引系统,无需从头重新处理一遍整个系统。 [5] Wang Lam等开发了类似于Map-reduce框架、专注于快速处理数据的Muppet; 第二类方法,实时云计算系统: [6] MIT等三所高校的研究人员联合研发了第二代分布式流处理系统Borealis; [7] Sheheryar?Malik设计了具有良好错误容忍机制的实时云计算系统;Harmeek Singh Bedi申请了实时云计算系统的专利; [8] Baidu Dstream, 淘宝Beales, Facebook Puma,Twitter Storm,Yahoo! S4 [9] 2011年组织了以实时云计算和虚拟化为主题的国际讨论组会RTSOAA(Real-Time Cloud Computing and Virtualization)。 [10] 2011年度的Hadoop?China大会一个热点议题就是数据流计算,在MapReduce计算模型风靡全球之后,Stream?Processing将会是下一个研究热点,无论是在工业界还是学术界。 ;;Hadoop家族;开源工具简介---批处理;开源工具简介---实时计算;开源工具简介---全内存查询;;国内相关计算平台;1、每天有超过30亿的店铺、商品浏览记录,10亿在线商品数,上千万的成交、收藏和评价数据。 2、量子统计、数据魔方和淘宝指数。 3、Hadoop集群:1500个节点,每天有大约40000个作业对1.5PB的原始数据按照产品需求进行不同的MapReduce计算。 4、Storm集群:处理实时流数据。 ;数据存储引擎:MySQL的MyISAM引擎 统计数据:10TB(分布在20个节点),每天6亿条的增量 节点类型划分: 热节点:SAS硬盘(15000转/分钟) 4.5W/TB 冷节点:SATA硬盘(7500转/分钟) 1.6W/TB 缺点:不能解决全属性选择器问题,这时NoSql是对其的有益补充。;国内相关计算平台;目录;;Storm数据流处理引擎整体架构;;;;;;相关工作;元组跟踪器总体结构;元组跟踪单元(acker)选择;元组跟踪单元(acker)选择;校验值更新策略;弹性可扩展协议;9、 人的价值,在招收诱惑的一瞬间被决定。七月-21七月-21Tuesday, July 06, 2021 10、低头要有勇气,抬头要有低气。22:44:4022:44:4022:447/6/2021 10:44:40 PM 11、人总是珍惜为得到。七月-2122:44:4022:44Jul-2106-Jul-21 12、人乱于心,不宽余请。22:44:4022:44:4022:44Tuesday, July 06, 2021 13、生气是拿别人做错的事来惩罚自己。七月-21七月-2122:44:4022:44:40July 06, 2021 14、抱最大的希望,作最大的努力。06 七月 202110:44:40 下午22:44:40七月-21 15、一个人炫耀什么,说明他内心缺少什么。。七月 2110:44 下午七月-2122:44July 06, 2021 16、业余生活要有

文档评论(0)

189****5087 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7102116031000022
认证主体仪征市思诚信息技术服务部
IP属地江苏
统一社会信用代码/组织机构代码
92321081MA278RWX8D

1亿VIP精品文档

相关文档