- 1、本文档共45页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DB2分区数据库
现阶段,存储介质和数据处理技术发展迅速,涌现了大批新技术,但这些仍不能满足企业数据快速增长的需求。为了加快企业数据读写操作和查询操作的速度,数据库分区技术应运而生。数据库分区是一种物理数据库设计技术,是将一个或多个数据库表分布在两台以及多台物理或者逻辑机器上,通过并行的方式对分布在多台机器上的数据库表进行处理,从而实现对数据的快速处理。数据库分区的主要目的是为了在特定的SQL操作中减少数据读写的总量以缩减响应时间。
▲数据库分区架构的三种类型
通过数据库分区技术可以提高对大容量数据的访问速度,对数据进行并行读取,并且数据库分区技术在一定程度上具有可扩展性。从架构上来看,数据库分区可划分为三种典型的架构:共享内存(Shared Memory)模式,共享磁盘(Shared Disk)模式以及无共享(Shared Nothing)模式。本文将重点介绍无共享模式的DB2数据库的分区特性,以及DB2与Oracle数据库分区特性的比较。
DB2数据库分区特性——DPF
DB2的企业版提供的数据库分区功能,即DPF(Data Partitioning feature),这一功能主要用来为大规模数据处理提供支持。DB2数据库分区采用Share-nothing体系结构,数据库在一个非共享的环境中被分解为独立的分区,每个分区都具有自己的资源,例如内存、CPU和磁盘以及自己的数据、索引、配置文件和事务日志。数据库分区有时称为节点或数据库节点,每个节点具有独立处理单一任务的能力,每个子任务处理一部分数据,分区间数据通过高速网络进行交互。
DB2 DPF的扩展性较好,通过增加节点资源即可线性扩展节点。简单来说,它相当于将一个大的数据库分成多个小的数据库,而每一个小数据库分区拥有自己的一部分数据,同时达到节点同时并发的高效率处理能力。DPF是一种跨多个彼此合作的实例,以建立单个大型数据库服务器的技术。这些实例既可以位于一个服务器中,也可以跨多个物理机器。
▲DB2 DPF体系架构图
DB2 DPF是基于并行性的体系架构,这里的并行包括在节点之间的并行,以及在节点之内分区的并行;查询语句之间的并行,以及查询语句内部的并行等。在性能方面,采取分而治之的策略,没有限制的规模。在编译器方面,采用基于开销的优化器和查询重写器,SQL和实用工具完全平行运行。除此之外,DPF还根据负载动态分流,同时支持异步I/O和平行I/O等。
DB2 DPF及其他分区特性的比较
IBM DB2的分区特性包括表分区(Table Partition)、多维聚类(MDC)和数据库分区特性(DPF)。具体对比如下表:
CREATE TABLE 语句中的子句 DB2 特性名称 DISTRIBUTE BY HASH DPF —— 数据库分区特性 ORGANIZE BY DIMENSION MDC —— 多维聚类 PARTITION BY RANGE TP —— 表分区 ▲DB2表设计特性——CREATE table 语句对比
DB2 特性名称 一部分的名称 用于分区数据的列 其他术语 数据分区特性(Data Partitioning Feature,DPF) 数据库分区 分布键(distribution key) 在之前的版本中,分布键被称作分区键 多维聚类(Multidimensional Clustering,MDC) 单元格,由一些块组成 维 块索引 表分区(TP) 数据分区 表分区键 ▲DB2表设计特性——相关术语
特性 特性如何组织数据 优点 DPF 将行均匀地分布在多个数据库分区上 可伸缩性 —— 随着数据库的增长增加计算资源(也就是数据库分区) MDC 将在多维上具有近似值的行放在表中相同的物理位置,即所谓的块 查询性能 —— 组织数据的方式有利于获得更快的检索速度,对于由多个谓词指定范围的查询尤其有效 TP 将所有行放在同一个数据分区的一个指定范围的维中 数据移动 —— 通过添加和删除整个数据分区,可以增加和删除大量数据 ▲DB2表设计特性——简要对比
特性 适合的表特征 事实表的特征 DPF 大型表 —— 大到无法仅依靠单独一组 CPU 和 I/O 通道来处理 事实表是最大的数据库表。它们常常包含数亿行数据,有时候甚至包含数千亿行数据 MDC 结果集返回在多个维上具有近似值的行的查询 事实表(以及通常所说的数据仓库)是为支持这种类型的查询而设计的 TP 这种类型的表:周期性地添加大量数据,然后在数据到期后又删除大量数据 在事实表中,常常是每天都添加新数据。通常每月或每个季度删除过时的数据 ▲DB2表设计特性——事实表特征
分区特性设计决定 经验法则 DPF —— 用作分布键
您可能关注的文档
- 2013数学建模一等奖.doc
- 2013版《思考与练习》参考答案.doc
- 2013版思修第四章学习道德理论注重道德实践.doc
- 2013物流工程毕业设计部分论文题目讨论稿.doc
- 2013浙江省公务员行测模拟冲刺卷试题+答案.doc
- 2013电大西方行政学说选择填空题排序版.doc
- 2013电大生产与运作管理考试答案.doc
- 2013理综生物专练3.doc
- 2013绍兴市科研方法与论文写作实战试卷及答案必威体育精装版.doc
- 2013电大西方行政学说考试答案.doc
- 某风场第一届运维人员技术技能比武理论(B)试题答案 .pdf
- 燃气安全管理考试试题 .pdf
- 第17讲 阅读理解词义猜测题(讲义)-2024年高考英语一轮复习讲练测(新.pdf
- 汽车构造习题. .pdf
- 必威体育精装版华中师范大学第一附属中学初升高自主招生语文模拟精品试卷【含解完整版720830994.pdf
- 第四单元认识万以内的数重难点检测卷(单元测试)-2022-2023学年二年级下 .pdf
- 新意+写作应用+同步语篇-2024年高考英语3500词汇一 .pdf
- 部编版五年级语文下册期末复习《积累运用与课文理解》专项测试卷及答案.pdf
- 必威体育精装版苏教版小学数学四年级下册第二单元素养评价试题(附答案)完整版720784120.pdf
- (完整版)人教版九年级下册《道德与法治》期末测试卷带答案 .pdf
文档评论(0)