大数据技术及应用大数据存储和管理分布式数据库(nosql)第三课.pdfVIP

大数据技术及应用大数据存储和管理分布式数据库(nosql)第三课.pdf

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据技术及应用大数据存储和管理分布式数据库(nosql)第三课

大数据技术与应用 网络与交换技术国家重点实验室 交换与智能控制研究中心 程祥 2016年9月 提纲-大数据存储和管理 1. 分布式文件系统 1.1 概述 1.2 典型分布式文件系统 1.3 HDFS 2. 分布式数据库 2.1 概述 2.2 NoSQL 2.3 HBase 2.4 MongoDB (略) 2.5 云数据库 (略) 2.1 分布式数据库概述 四类典型的用于大数据存储和管理的分布式数 据库系统有: 1. 并行数据库 2. NoSQL数据管理系统 3. NewSQL数据管理系统 4. 云数据管理系统 2.1 概述-并行数据库 • 定义 通过并行使用多个CPU和磁盘来将诸如装载数据、建立索 引、执行查询等操作并行化以提升性能的数据库系统。往 往运行在通用计算机组成的集群环境中。 • 优点 通过多个节点并行执行数据库任务、提高整个数据库系统 的性能和可用性。 • 不足 并行数据库设计和优化时认为集群中节点数量是固定的, 若果对集群进行扩展或收缩,数据转移成本高,还会导致 系统一段时间不可用。 认为节点故障是特例,因此只提供事务级别的容错,如果 查询过程中节点出错,整个查询需要重运行。 2.1 概述-NoSQL数据管理系统 • 定义  没有固定数据模式并且可以水平扩展的系统被称为NoSQL。NoSQL不支 持关系数据模型。 • 优点  数据模型简单,每条记录拥有唯一的键,一次操作获取单个记录增强 了系统可扩展性。  与并行数据库不同,NoSQL数据系统能够基于低端硬件(通用PC机) 进行水平扩展,灵活性高,成本低。  NoSQL数据系统吞吐量比传统关系数据管理系统要高很多,例如, Google的Bigtable每天可处理20PB的数据。 • 不足  不支持ACID特性,然而,ACID特性能够使系统在中断的情况下保证在 线事务能够准确执行。  NoSQL系统提供不同的查询模型,增加了开发者负担。 2.1 概述-NewSQL数据管理系统 • 定义 既能够支持传统关系型数据库的ACID事务特性和SQL查询 ,又能够提供NoSQL数据管理系统的可扩展性的数据管理 系统。NewSQL是对传统基于SQL的关系型数据库的创新。 • 特性  支持关系数据模型 使用SQL作为主要接口 具有高吞吐量和高可扩展性 2.1 概述-云数据管理系统 • 定义 基于云计算技术的数据管理系统,用户无需在本地安装数 据库软件,只需使用“云数据库服务提供商”提供的数据 库服务即可。 • 优点  用户无需购买基础设施和软件,性价比高。  用户可以根据自己的需求申请存储资源即可,并且可以根 据应用需求动态变化,可伸缩性好。  用户无需考虑云数据库底层的硬件和软件实现,只需要通 过其提供的接口使用其服务。 • 不足 存储在云数据库中的数据可能会造成隐私泄露 2.2 NoSQL 2.2.1 NoSQL简介 2.2.2 NoSQL的兴起原因 2.2.3 NoSQL与关系数据库的比较 2.2.4 NoSQL的四大类型 2.2.5 NoSQL理论基础 2.2.6 从NoSQL到NewSQL 2.2.1 NoSQL简介 概念演变 最初表示“反SQL”运动 现在表示关系和非关系型数据库各有优缺点 用新型的非关系数据库取代关系数据库 彼此都无法互相取代 通常,NoSQL数据库具有以下几个特点: (1)数据模型灵活、简洁 (2)水平可扩展性强 (3)系统吞吐量高 目前NoSQL数据库已经广泛应用于谷歌、亚马逊、Facebook、 百度、阿里、腾讯等大型互联网公司。

文档评论(0)

celkhn0303 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档