- 1、本文档共39页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
大数据概述
大数据4V特性
相关领域应用..
相关技术架构
目录..
大数据概述
数据量级变化
大数据产生背景
数据量级不断增加|根据IDC监测,人类产生的数据
量正在呈指数级增长,大约每两年翻一番,这个速度在2020年之前会继续保持下去。
数据结构日趋复杂|大量新数据源的出现则导致非结构化、半结构化数据爆发式的增长
TB
PB
ZB
EB
地球上至今的数据量..:
在2006年,个人用户才刚刚迈进TB时代,全球一共新产生了约180EB的数据;
在2011年,这个数字达到了1.8ZB。
而有市场研究机构预测:到2020年,整个世界的数据总量将会增长44倍,达到35.2ZB(1ZB=10亿TB)
说明
互联网(社交、有哪些信誉好的足球投注网站、电商)、移动互联网(微博)、物联网(传感器,智慧地球)、车联网、
GPS、医学影像、安全监控、金融(银行、股市、保险)、电信(通话、短信)都在疯狂产生着数据。
1GB(Gigabyte)=1024MB1TB(Terabyte)=1024GB1PB(Petabyte)=1024TB1EB(Exabyte)=1024PB1ZB(Zettabyte)=1024EB
大数据时代
变化
在web2.0的时代,人们从信息的被动接受者变成了主动创造者
数据
全球每秒钟发送2.9百万封电子邮件,
每天会有2.88万个小时的视频上传到
Youtube,
推特上每天发布5千
万条消息
量级
每月网民在Facebook上要花费7千亿分钟,发送和接收的数据高达
1.3EB
Google上每天需要处理24PB的数据…
多大样数性据的定义..
大数据(bigdata),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
想驾驭这庞大的数据,我们必须了解大数据的特征…。
社交网络
…
电子商务 淘宝、ebuy
…
微博、Apps 移动互联
…
大数据的 特性
数据结构
海量
存储能力
读写速度
实时..
大数据
分析
hadoophbase
sparkstrom
大数据典型特性——存储能力变化
▲数据量不断增加,存储能力也随之不断增强
存储能力
大数据典型特性——读写速度提升
▲与云计算相结合的大数据存储速度显著提升
数读读写写速速度度
大数据典型特性——多样性发展
▲数据结构更加复杂,呈多样性发展
多样性
1
2
3
4
体量Volume
多样性Variety
价值密度Value
速度Velocity
4V
特
性
从非结构化数据的超大规模和增长,比结构化数据增长快10倍到50倍,是传统数据仓库的10倍到50倍,总数据量的80~90%
大数据的异构和多样性,多种形式(文本、图像、视频、机器数据),无模式或者模式不明显,
不连贯的语法或句义
大量的不相关信息对未来趋势与模式的可预测分析,深度复杂分析,机器学习、人工智能Vs传统商务智能(咨询、报告等)…
实时分析而非批量式分析,数据输入、处理与丢弃,立竿见影而非事后见效…
相关领域应用
①建设公共基础设施应该如何选址?
②怎样有效提高公众生活安全水平?
③人口土地、资源利用如何优化?
④自然灾害、雾霾情况怎样最大化去改善?
⑤城市交通拥堵情况怎么去解决?
合理规划很重要
消费行业
电子商务
金融服务
军事
食品安全
气象
交通环保
医疗卫生
VS
优化城市
优化
正确方式
VS
改善生活
最优
正确方式
用户行为数据
用户消费数据
互联网金融数据
用户社交等UGC数据
用户地理位置数据
互联网大数据
简单罗列几个行业
合理使用大数据
大数据之提高经济策略
金融服务
电子商务
消费行业
根据用户的喜好、交易记录并制定权重匹配商品,提供准确的推送
根据不同地域、不同年龄段的人群的消费情况及生活习惯,制定提供最优服务的计划
结合热点、题材、政策和历史数据及趋势分析,制定良好的方向
相关技术
数据灵活
低价格
高性能
数据灵活
非关系型(列)
数据库
性能对比
优点
缺点
优点
缺点
易理解使用方便支持sql易于维护
价格昂贵不能自动切片固定表结构读写性能差
高并发读写需求
关系型数据库
场景不同效果也不同,目前NoSql是最为合适大数据发展的
关系型数据库:Mysql、Oracle、SQserver等
云计算
移动电话
PCs
PDAs
GPS
导航
汽车电子设备
智能家电
iPhone
DCs
传感器
TVs 。。。
云计算(cloudcomputing)是基于互联网的相关服务
文档评论(0)