hadoop大数据处理讲义-c1. 海量数据处理概论.pdf

hadoop大数据处理讲义-c1. 海量数据处理概论.pdf

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
hadoop大数据处理讲义-c1. 海量数据处理概论

海量数据处理中的云计算 C1. 海量数据处理概论 北京邮电大学信息与通信工程学院 刘军 liujun@ 2014年春季学期 本节目录  海量数据的定义与特征  海量数据带来的技术挑战  海量数据处理的三大关键问题  海量数据处理的云计算变革 第2页 本节目录  海量数据的定义与特征  海量数据带来的技术挑战  海量数据处理的三大关键问题  海量数据处理的云计算变革 第3页 炙手可热的海量数据  海量数据(Massive Data )= 大数据(Big Data )  当前科技与产业领域的第一热词 Google Trends数据(2004 -2013 )  Gartner调查报告 – 2012年,全球Big Data相关IT投资总额为280亿美元 – 2013年,将达到340亿美元,增长率超过20%。 – 到2015年,将在全球范围内创造440万工作岗位。 第4页 什么是海量数据  数据量超过一定大小,导致常规软件无法在一个可接受的时间范围内 完成对其进行抓取、管理和处理的工作的数据,例如: – 互联网上的网页数据 – 社交网站上的用户交互数据 – 物联网中产生的活动数据 – 电信网络中的话单数据  海量数据的三大特征(3V ): 型型 高高 类类 非结构化非结构化 实时数据实时数据 时时 – 数据量大小 – 大容量(Volume ) 多多 效效 – 数据类型 – 多类型(Variety ) 结构化结构化 历史数据历史数据 – 数据时效性 – 高时效(Velocity ) TBTB ZBZB 大容量大容量 第5页 海量数据特征(1 )– 大容量(Volume )  爆炸的数据世界中每1分钟发生的:  GB/TB/PB/EB/ZB/YB  IDC统计 : Email :2.04亿封 – 2012年全球数据量:2.7ZB Google :200万次有哪些信誉好的足球投注网站 – 相当于全球70亿人口每人420G – 比2011年增长48% Flicker :3125张照片上

文档评论(0)

牛X文档 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档