- 1、本文档共71页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
;提纲;每天有2940亿封电子邮件发生,如果这些是纸质信件,在美国需要花费两年时间处理。
每天有200万篇博客在网上发布,这些文章相当于《时代》杂志刊发770年的总量。
每天有2.5亿张照片上传至社交网站Facebook,如果都打印出来,摞在一起能有80个埃菲尔铁塔那么高。
每天有86.4万小时视频被上传至视频网站Youtube,相当于不间断播放视频98年。
每天有1.87亿个小时的音乐会在流媒体音乐网站Pandora上播放,如果一台电脑从公元元年就开始播放这些音乐会,到现在还没完没了地接着放。;;;地球上至今总共的数据量:
在2006年,个人用户才刚刚迈进TB时代,全球一共新产生了约180EB的数据;
在2011年,这个数字达到了1.8ZB。
而有市场研究机构预测:
到2020年,整个世界的数据总量将会增长44倍,达到35.2ZB(1ZB=10亿TB)!;2008年9月4日《自然》杂志社,推出的名为“大数据”的专刊,创造出了“大数据”这个概念。;美国疾病控制中心要在流感暴发两周后才知道
谷歌的大数据预测只需要一天;大数据(bigdata),巨量数据集合
是指无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合。;“大数据”特征;Hadoop是基于Google有关大数据的论文实现的开源项目,最初的框架由DougCutting在2005年提出,目前是由Apache维护的开源项目。从初创到现在,Hadoop体系在几年中开发完成了一系列重要的子项目,已经形成了一个涵盖数据存储、管理和分析功能的较为完整的大数据生态系统,成为大数据存储与处理领域地位最重要、应用最广泛的开源框架。;Hadoop是运行在大量通用计算单位上提供海量数据存储与并行计算的平台框架。
基于X86集群水平可扩展
基于MapReduce的并行计算能力
设计规模:PB级的数据量,数千台计算节点;提纲;量化思维——一切皆可量化
决策思维——让数据驱动
全样思维——样本=总体
关联思维——追求相关关系
……;StephenBeck
每一天,我们的身后都拖着一条由个人信息组成的长长的“尾巴”,这只是因为我们生活在一个现代化的世界。我们——
◎点击网页
◎切换电视频道
◎驾车穿过自动收费站
◎用信用卡购物
◎使用手机
而雅虎、Google这样的公司,正在以平均每人、每月2500条信息的速度,捕获我们的详细数据。
;数据是指存储在某种介质上能够识别的物理符号,是对客观事物性质和状态的描述。
先有数据再说应用。;量化坐姿
日本先进工业技术研究所(Japan’sAdvancedInstituteofIndustrialTechnology)的教授越水重臣(ShigeomiKoshimizu)所做的研究就是关于一个人的坐姿。很少有人会认为一个人的坐姿能表现什么信息,但是它真的可以。当一个人坐着的时候,他的身形、姿势和重量分布都可以量化和数据化。越水重臣和他的工程师团队通过在汽车座椅下部安装总共360个压力传感器以测量人对椅子施加压力的方式。把人体屁股特征转化成了数据,并且用从0~256这个数值范围对其进行量化,这样就会产生独属于每个乘坐者的精确数据资料。
在这个实验中,这个系统能根据人体对座位的压力差异识别出乘坐者的身份,准确率高达98%。;这项技术可以作为汽车防盗系统安装在汽车上。有了这个系统之后,汽车就能识别出驾驶者是不是车主;如果不是,系统就会要求司机输入密码;如果司机无法准确输入密码,汽车就会自动熄火。
通过汇集这些数据,我们可以利用事故发生之前的姿势变化情况,分析出坐姿和行驶安全之间的关系。这个系统同样可以在司机疲劳驾驶的时候发出警示或者自动刹车。同时,这个系统不但可以发现车辆被盗,而且可以通过收集到的数据识别出盗贼的身份。;苹果在2008年申请的“耳机、耳塞或耳麦的运动检测系统”专利。
这种包含各种传感器的耳机可以检测各项生理指标,包括体温、心率和排汗水平。
根据专利文件,健身检测系统被隐藏在耳机中,用户通常在运动时戴着耳机听音乐。通过将耳机放在耳朵里或附近,嵌入的运动传感器可以获得体温、排汗和心率方面的数据。除了基于皮肤的检测功能,耳机内部还可以集成加速度传感器,这样可以收集准确的运动数据。;*;2015年的3月15日,马云在德国的汉诺威IT博览会上的主题演讲:
“一家互联网公司要想活得长久,必须找到一个方式让互联网经济和实体经济相结合,这个方式就是数据。”
“未来的世界,我们将不再由石油驱动,而是由数据驱动。”;*;*;*;2011年发布的lytro相机就是一款具有“大数据”的相机。传统的相机只可以记录一束光的不同,而lytro相机可以收录这个光场所有的光,达到1100万束左右。具体生成什么样的照片则可以在拍
您可能关注的文档
- 大数据时代的学习变革.ppt
- 大数据时代下的数据挖掘简易.ppt
- 大数据挖掘外文翻译文献.docx
- 大数据技术的创新与实践.pptx
- 大数据征信讲义..ppt
- 大数据可视化PPT.pptx
- 大数据分析方法与技术实务.pptx
- 大数据价值PPT(必威体育精装版文档).pptx
- 大数据云计算PPT.pptx
- 大数据之pig详解.pptx
- GB/T 39560.10-2024电子电气产品中某些物质的测定 第10部分:气相色谱-质谱法(GC-MS)测定聚合物和电子件中的多环芳烃(PAHs).pdf
- 中国国家标准 GB/T 39560.10-2024电子电气产品中某些物质的测定 第10部分:气相色谱-质谱法(GC-MS)测定聚合物和电子件中的多环芳烃(PAHs).pdf
- 《GB/T 39560.10-2024电子电气产品中某些物质的测定 第10部分:气相色谱-质谱法(GC-MS)测定聚合物和电子件中的多环芳烃(PAHs)》.pdf
- GB/T 39560.302-2024电子电气产品中某些物质的测定 第3-2部分:燃烧-离子色谱法(C-IC)筛选聚合物和电子件中的氟、氯和溴.pdf
- 中国国家标准 GB/T 39560.2-2024电子电气产品中某些物质的测定 第2部分:拆解、拆分和机械制样.pdf
- 中国国家标准 GB/T 39560.302-2024电子电气产品中某些物质的测定 第3-2部分:燃烧-离子色谱法(C-IC)筛选聚合物和电子件中的氟、氯和溴.pdf
- GB/T 39560.2-2024电子电气产品中某些物质的测定 第2部分:拆解、拆分和机械制样.pdf
- 《GB/T 39560.2-2024电子电气产品中某些物质的测定 第2部分:拆解、拆分和机械制样》.pdf
- 《GB/T 39560.303-2024电子电气产品中某些物质的测定 第3-3部分:配有热裂解/热脱附的气相色谱-质谱法(Py/TD-GC-MS)筛选聚合物中的多溴联苯、多溴二苯醚和邻苯二甲酸酯》.pdf
- 中国国家标准 GB/T 39560.303-2024电子电气产品中某些物质的测定 第3-3部分:配有热裂解/热脱附的气相色谱-质谱法(Py/TD-GC-MS)筛选聚合物中的多溴联苯、多溴二苯醚和邻苯二甲酸酯.pdf
文档评论(0)