- 1、本文档共20页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
信息技术基础Informationtechnologybase认识大数据Windows10+Office2016
认识大数据1大数据的概念2大数据的特征3数据的计量单位4大数据处理的基本流程5大数据的典型应用领域
学习情景情景描述王明在使用计算机时发现,网页中经常会推荐一些他曾经有哪些信誉好的足球投注网站或关注过的信息,如前段时间,他在天猫上购买了件T恤,然后每次打开天猫网页时,在推荐购买区都会显示一些同类的物品。王明觉得很神奇,经过了解,才知道这是大数据技术的一种应用,它将用户的使用习惯、有哪些信誉好的足球投注网站习惯记录到数据库中,应用独特的算法计算出用户可能感兴趣或有需要的内容,然后将相同的类目推荐到用户眼前。今天我们就王明同学一起去了解大数据技术的定义和发展,了解数据的计量单位,熟悉大数据处理的基本流程和大数据的典型应用案例。
知识目标能力目标素质目标了解大数据的基本概念;了解大数据的应用。利用大数据思维思考问题培养学生的生活应用知识与理论知识的衔接能力。目标
重点了解大数据的基本概念;了解大数据的应用难点具备大数据思维能力重点难点
1大数据的概念
什么是大数据大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统。
2大数据的特征
大数据的特征一是数据体量巨大(Volume)。截至目前,人类生产的所有印刷材料的数据量是200PB(1PB=210TB),而历史上全人类说过的所有的话的数据量大约是5EB(1EB=210PB)。二是数据类型繁多(Variety)。类型的多样性让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,多类型数据对数据的处理能力提出了更高要求。三是价值密度低(Value)。价值密度的高低与数据总量的大小成反比。以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一二秒。如何通过强大的机器算法更迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。四是处理速度快(Velocity)。这是大数据区分于传统数据挖掘的最显著特征。在海量的数据面前,处理数据的效率就是企业的生命。
3数据的计量单位
数据的计量单位在研究和应用大数据时,经常会接触到数据存储的计量单位,而随着大数据的产生,数据的计量单位也在逐步发生变化。MB、GB等常用单位已无法有效地描述大数据,典型的大数据一般会用到PB、EB和ZB这3种单位。数值换算单位名称1024B=1KB千字节(KiloByte)1024KB=1MB兆字节(MegaByte)1024MB=1GB吉字节(GigaByte)1024GB=1TB太字节(TeraByte)1024TB=1PB拍字节(PetaByte)1024PB=1EB艾字节(ExaByte)1024EB=1ZB皆字节(ZettaByte)1024ZB=1YB佑字节(YottaByte)1024YB=1NB诺字节(NonaByte)
4大数据处理的基本流程
基本流程在处理大数据的过程中,通常需要经过采集、导入、预处理、统计分析、数据挖掘和数据展现等步骤。数据抽取与集成:数据的抽取和集成是大数据处理的第一步,从抽取数据中提取出关系和实体,经过关联和聚合等操作,按照统一定义的格式对数据进行存储。数据分析:数据分析是大数据处理的核心步骤,在决策支持、商业智能、推荐系统、预测系统中应用广泛,在从异构的数据源中获取了原始数据后,将数据导入一个集中的大型分布式数据库或分布式存储集群,进行一些基本的预处理工作,然后根据自己的需求对原始数据进行分析。数据解释和展现:在完成数据的分析后,应该使用合适的、便于理解的展示方式将正确的数据处理结果展示给终端用户,可视化和人机交互是数据解释的主要技术。
5大数据的典型应用领域
医药研发医药公司能够通过大数据技术分析来自互联网上的公众疾病药品需求趋势,确定更有效率的投入产出比,合理配置有限研发资源。除此之外,在医药副作用研究方面,医疗大数据技术可以避免临床试验法、药物副作用报告分析法等传统方法存在的样本数小、采样分布有限等问题,从千百万患者的数据中挖掘到与某种药物相关的不良反应,样本数大,采样分布广,所获得结果更具有说服力。此外,还可以从社交网中有哪些信誉好的足球投注网站到大量人群服用某种药物的不良反应记录,通过比对分析和数据挖掘方法,更科学、更全面地获得药物副作用的影响。
金融领域银行可以利用持卡人基本信息、卡基本信息、交易历史、客户历史
您可能关注的文档
最近下载
- 人教新目标八年级下册英语全册教案(最全).doc
- 中国风能太阳能资源年景公报2014.pdf
- 2021年数学英才登高系列活动(CMTS)试题.pdf
- 对培育当代革命军人核心价值观的调查与思考.docx
- 2013-2022年十年高考英语各题型考点对比分析(共7个专题).pdf
- 某市医疗保障局年深入开展医保领域群众身边腐败和作风问题专项整治工作方案.docx VIP
- 论持久战全文--毛泽东_txt下载.docx
- RIGOL普源精电DSA800配置手册用户手册.pdf
- 【大单元教学】第一单元《民艺蕴情》第2课《多样的中国民间美术》课件(36页)--人美2024版七年级下册.pptx VIP
- 劳动出版社《电机与电气控制(第三版)习题册》答案.pdf
文档评论(0)