MongoDB白皮书之-DB对比介绍.pdf

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
MongoDB白皮书之-DB对比介绍

⼤数据时代的数据存储—MongoDB 导语:在过去的很⻓⼀段时间中,关系型数据库⼀直是最主流的数据库解决⽅案,她运⽤真实 世界中事物与事物的关系来解释数据库中抽象的数据。然⽽,在信息技术、⽤户基数、数据量 等爆炸式发展的今天,⼤数据已经成为了继云计算,物联⺴后新的技术⾰命,关系型数据库在 处理⼤数据量时已经开始吃⼒,开发者只能通过不断地优化数据库来解决数据量的问题,但优 化毕竟不是⼀个⻓期⽅案,所以⼈们提出了⼀种新的数据库解决⽅案来迎接⼤数据时代的到来 ——NOSQL。 ⼀、RDBMS⾯对数据(以MySQL为例)访问的压 ⼒,通常采取的解决⽅案步骤 1、主从复制,实现读写分离或分布读; 2、读请求比较多,可添加缓存服务器,如Memcached/Redis,以提升 读性能;但手动维护数据的一致性往往也是一个不小的一个挑战 ; 3、写请求较多的场景,可简单进行向上扩展,使用性能更强的服务器以 应付更多的写请求;同时,为了保证从服务器跟得上主服务器的更新速 度,可能需要从服务器使用与主服务器相同的配置;此法性价比不高; 4、数据访问压力进一步增大时,联结查询性能会急剧下降;此时就得进 行“反模式”化设计,将表根据业务需求进行合并,以增大数据冗余来 换取系统性能; 5、停用存储过程、存储函数或触发器等代码,将对应的功能在应用程序 中完成; 6、删除表的各辅助索引,改写查询使其仅使用主键索引; 7、数据库切分,此法复杂度较大,维护成本较高;且数据规模再次提升 时重新切分的成本高昂,二次扩展能力受限; ⼆、RDBMS与NoSQL 实际使用中,只要架构得当,关系型数据库完全能够服务于各种级别的 数据存储应用,比如国外知名企业Facebook、Google等各自有着运转 良好的MySQL服务器集群,服务于不同层次不同领域的数据存储场景。 但此等规模的应用需要强大的技术实力突破各式各样的应用限制,这也 会带来居高不下的维护成本(高端人才和高配物理服务器),尽管如此 关系型数据库一些“天生性”的限制依然会成为应用中的梦魇和沼泽之 地。于是,近几年来,一些被归类为NoSQL的新项目或框架在多个组织 或企业中爆发式涌现。这些新项目或框架很少提供类似SQL语言一样的查 询语言,而是提供了一种简化的、类API的数据访问接口。但RDBMS与 NoSQL真正的不同之处在于低层,即存储级别,因为NoSQL通常不支持 事务或辅助索引的功能等。 另一方面,NoSQL的著名项目中彼此间有许多功能是重叠的,甚至有不 少特性与传统的关系型数据库的功能也存在相同之处,因此NoSQL算不 上革命性的技术,尽管从工程师的眼下其绝对是革命性的。于是,现实 中,memcached也被划归了NoSQL阵营,似乎不属于RDBMS的存储管 理类程序都自然而然的属于NoSQL,NoSQL也因而成为了非RDBMS系 统的“海纳百川”之地。然而,“有容乃大”就难免“鱼龙混杂”,为 了便于理解,这里从多个维度来对NoSQL的主流技术进行简单的归类, 以便对此能有个概括性的认识,并能够在实际应用场景中有个可以参照 的选择标准。 1、数据模型 数据模型指数据的存储方式,其有好几个流派,如关系、键值、列式、 文档及图像等。在它们的各自实现中,关系型数据库有Oracle、SQL Server、MySQL、PostgreSQL等,键值数据库有memcached、 membase、Riak、Redis等,列式数据库有HBase、Cassandra、 Hypertable等,文档数据库有MongoDB、CouchDB等,图像数据库有 Neo4J等。在选用某特定的NoSQL产品时,应该事先评估应用程序是如 何访问数据的,以及数据的Schema是否经常演进等。 2、存储模型 指数据存储是基于内存存储还是持久存储。 3、一致性模型 存储系统在何种级别实现数据一致性,严格一致性还是结果一致性。一 致性的等级可能会对数据访问延迟带来巨大影响。 4、物理模型 在物理模型上可归类分布式存储及单机存储。对分布式存储而言,其扩 展能力及易扩展性如何也是一个重要的衡量指标。 5、读/写性能 对于工作在不同应用场景中的应用程序而言,其读/写需求有着显著不同。 而不同的NoSQL产品也有着不同的适用性。 6、辅助索引 辅助索引有助于实现在非主键字段上完成排序、查询操作等;有的NoSQL 产品不提供此类功能。 7、故障处理 不同的应用场景其故障恢复的时间容忍度不同,而不同的NoSQL产

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档