- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
大数据技术与应用什么是大数据1Part1什么是大数据数据没有办法在可容忍的时间下使用常规软件方法完成存储、管理和处理任务何为大?—数据度量1Byte=8Bit1KB=1,024Bytes1MB=1,024KB=1,048,576Bytes1GB=1,024MB=1,048,576KB=1,073,741,824Bytes1TB=1,024GB=1,048,576MB=1,099,511,627,776Bytes1PB=1,024TB=1,048,576GB=1,125,899,906,842,624Bytes1EB=1,024PB=1,048,576TB=1,152,921,504,606,846,976Bytes1ZB=1,024EB=1,180,591,620,717,411,303,424Bytes1YB=1,024ZB=1,208,925,819,614,629,174,706,176BytesPart1什么是大数据大数据定义:所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。主要的特点:Volume数据体量Velocity数据速度Variety数据多样Veracity数据真实4V特征Part1什么是大数据大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据就是“未来的新石油”。大数据的特征2Part2大数据的特征BigData大数据Volume非结构化数据的超大规模和增长总数据量的80~90%比结构化数据增长快10倍到50倍是传统数据仓库的10倍到50倍数据量体Value大量的不相关信息对未来趋势与模式的可预测分析深度复杂分析(机器学习、人工智能Vs传统商务智能)数据价值Variety大数据的异构和多样性很多不同形式(文本、图像、视频、机器数据)无模式或者模式不明显不连贯的语法或句义数据多样Velocity实时分析而非批量式分析数据输入、处理与丢弃立竿见影而非事后见效数据速度Part2大数据的4V特征—Volume一般情况下,大数据是以PB、EB、ZB为单位进行计量的1Bity1ZB如同全世界海滩上的沙子数量总和1KB1YB相当于7000位人类体内的微细胞总和1MB5EB相当于至今全世界人类所讲过的话语1GB1PB相当于50%的全美学术研究图书馆藏书信息内容1TB单击此处添加正文,文字是您思想的提炼,请尽量言简意赅地阐述观点。1PB单击此处添加正文,文字是您思想的提炼,请尽量言简意赅地阐述观点。1EB单击此处添加正文,文字是您思想的提炼,请尽量言简意赅地阐述观点。1ZB单击此处添加正文,文字是您思想的提炼,请尽量言简意赅地阐述观点。1YBPart2大数据的4V特征—Velocity大数据的处理速度快实时数据流处理的要求,是区别大数据引用和传统数据仓库技术,BI技术的关键差别之一;1s是临界点,对于大数据应用而言,必须要在1秒钟内形成答案,否则处理结果就是过时和无效的;82254132215327现在及未来几年内美国的移动网络数据流量增长(PB/月)源自英国Coda研究咨询公司大数据的增长速度快Part2大数据的4V特征—Variety行业/企业内数据互联网数据物联网数据大数据数据来源多企业内部多个应用系统的数据、互联网和物联网的兴起,带来了微博、社交网站、传感器等多种来源。数据类型多保存在关系数据库中的结构化数据只占少数,70~80%的数据是如图片、音频、视频、模型、连接信息、文档等非结构化和半结构化数据。关联性强数据之间频繁交互,比如游客在旅行途中上传的图片和日志,就与游客的位置、行程等信息有了很强的关联性。Part2大数据的4V特征—Value挖掘大数据的价值类似沙里淘金,从海量数据中挖掘稀疏但珍贵的信息价值密度低(Value)价值密度的高低与数据总量的大小成反比。以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一二秒。如何通过强大的机器算法更迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。单击添加标题大数据技术简介及现况Part3大数据技术简介数据采集数据预处理数据存储数据分析挖掘数据可视化实时处理Spar
您可能关注的文档
- 大学物理第五章习题解答.ppt
- 小学语文质量分析报告.ppt
- 感染疾病科门诊布局.ppt
- 学前卫生学-第四章-儿童营养.ppt
- 学会归纳推理的方法.ppt
- 对学校内涵发展的思考和建议.ppt
- 成功无捷径-学习当奋斗.ppt
- 实现医患有效沟通的意义及其他.ppt
- 幼儿园-说课培训课件.ppt
- 导热塑料在LED室内照明灯具应用中的优势.ppt
- 2025年市总工会党组书记、市委组织部部长生活会“四个带头”个人对照检查发言材料2篇(含上年度整改+个人情况、个人事项+典型案例).docx
- 2025年部编版小学六年级下册《道德与法治》第四单元 让世界更美好第10课 我们爱和平教学课件.pptx
- 公司领导班子2025年围绕“四个带头”主题检视问题整改落实方案与组织生活会批评意见(20条)2篇文.docx
- 教育系统党组班子2025年对照“四个带头”含意识形态、以典型案例举一反三解析检视材料【2篇文】.docx
- 2025年国有企业领导班子、学校副校长生活会“四个带头”方面对照个人检视发言材料2篇文(附:上年度整改情况、典型案例解析).docx
- 2025年生活会“四个带头”个人对照检查材料2篇文(含对其他领导批评意见,个人公开事项申报、意识形态).docx
- 2025年国有企业党委书记、领导班子生活会“四个带头”方面对照检查发言材料2篇文(上年度整改情况).docx
- 乡镇领导班子、市委组织部常务副部长2025年对照“四个带头”含违纪行为为典型案例的剖析与反思检视剖析材料{2篇文}.docx
- 市委社会工作部2025年生活会领导班子对照检视发言材料2篇文(含以案为鉴,深刻反思存在问题、反面典型案例举一反三解析、其他需要说明情况).docx
- 2025年民主生活会、组织生活会批评意见(20条)与市直单位领导班子“四个带头”对照检查材料【含上年度查摆问题整改落实情况】2篇文.docx
最近下载
- 840Dsl-刀具管理简明调试.pdf VIP
- 2024年内蒙古建筑职业技术学院单招职业技能测试题库(b卷).docx VIP
- AAPD2014年初级未成熟牙髓治疗指南.pdf
- 《大头儿子和小头爸爸》导读.pptx VIP
- 2024年内蒙古建筑职业技术学院单招职业技能测试题库及答案(名校卷).docx VIP
- JJF 1471-2024 全球导航卫星系统(GNSS)信号模拟器校准规范.pdf
- 2.2《找一找》(课件) 2025北师大数学一年级下册.pptx
- 2024年内蒙古交通职业技术学院单招职业技能测试题库(名校卷).docx VIP
- 税务管理(第三版)梁俊娇课后习题答案.docx
- 2024年西安电力高等专科学校单招职业适应性测试题库及答案解析.pdf
文档评论(0)