[工学]11章_分布式数据库系统的发展趋势_.ppt

[工学]11章_分布式数据库系统的发展趋势_.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工学]11章_分布式数据库系统的发展趋势_

70年代的数据库机, 现代的数据库服务器 数据库服务器的优势 功能专一 专用OS, DBMS与OS紧耦合, 提高DBMS的总体性能 适于现实世界的分布环境 充分利用先进的硬件体系结构 缺点 额外的通信开销 因此要求服务器提供较高层次的接口, 关系模型操作是面向集合的操作, 所以成为服务器模型的首选 集中式服务器结构 明确分工, 减少工作站与服务器之间的通信 工作站对语言预处理(完整性检查, 安全控制) 工作站能访问数据目录 服务器管理和更新目录, 工作站只读目录 优化DBMS和OS(软方法), 或者使用多处理机(硬方法)解决服务器瓶颈问题 分布式服务器结构 两种查询处理方式 数据查询先提交到本地服务器,由其负责所有的分布式查询处理 每个应用服务器上也都可以由分布式查询处理器和数据目录操作器,直接访问远程数据服务器 数据服务器专门用于分布式和集中式数据库管理 在传统机器结构上,在分布式OS上执行DBMS和分布式DBMS 基于特定计算机系统结构实现分布式数据库操作系统 冯.诺依曼型计算机结构的局限 不能发挥应用中普遍存在的内在的可并行处理特性 关系操作本身的可并行性, JOIN中的多个子查询, 单个查询中的多步操作 数据库管理性能受到I/O瓶颈的影响 内存速度比硬盘速度快1000倍 增加带宽提高磁盘存取的并行性 使用并行可存取的多个小磁盘 多处理机结构 通过高速通信介质连接多个可独立处理的单元 通过分配,查询 操作和子操作到不同的处理单元, 以并行执行方式完成互连查询, 内部查询, 及各种内部操作 类型 完全共享资源结构 对每个数据项的存取都要经过公共通信线路,引起通信瓶颈 类似于集中式DBMS,差别是数据库操作可以并行处理 完全不共享资源结构 高功能计算机系统可以由多个较小的系统替代 每个站点都要实现全局数据目录,分布数据定义和控制,分布查询处理和分布式事务管理 站点不能运行应用程序 并行数据服务器数据定位 类似于分布式数据库中的数据片段定位 分簇(Declustering) 数据的水平分片 提高响应速度和内存查询并行度 聚簇(Clustering) 聚集关系的片段 综合查询或减少系统总体运行代价 程序应在数据存储的站点上运行 DDBS中DBA根据对片段的使用情况检测, 进行调整, 包括移动片段和重组。 并行数据服务器与DDBS的不同 应用目标不同 并行中用户不专门使用某个站点, 所以不要求最大化本地性处理 实现方式不同 站点间高速网互连, 传输代价小, 可以调节站点间工作负载 各站点地位不同 不存在全局应用和局部应用 各站点完全不独立, 处理时只能发挥协同作用, 无局部应用 数据定位方法 全分簇:片段分布到系统中所有有磁盘的站点 散列算法分片:查询时, 与选择属性精确匹配的子查询得以在一个站点上处理, 所有其它子查询在其他站点处理, 适于大范围多用户工作负载 但复杂查询(多个连接)时, 聚簇方法较好 可变分簇 依据“分簇度”对关系分片 分簇度是关系数据分片的站点数量, 是关系大小和存取频率的函数 这种方法比聚簇和分簇更加复杂,因为数据分布的改变可能导致结构调整 关联查询 传统系统中,关联存取是由查询处理器在编译时利用数据目录完成 并行系统中, 采用“全局索引”复制到每一个站点 全局索引 能确定关系在各站点分布的二级索引 主聚簇:关于关系名 次聚簇:关于关系中的某些属性 基于散列法或B树实现 例: 工程数据库 E(ENO, ENAME, DEPT, TITLE) S(TITLE, SAL) J(JNO, JNAME, BUDGET) G(ENO, JNO, RESP, DUR) 全局索引(查询ENO=‘E5’) 第一级关于关系名索引映射到E关系的ENO属性索引 第二级索引进一步映射值E5到站点j 本地索引(次簇索引) 映射一个关系到站点的一组磁盘块上 类似于全局索引 第一级关于关系名 第二级关于属性索引(映射簇值E5到91磁盘块) 实验结果 短事务负载下, 分簇数量增加, 事务吞吐量增加 多连接复杂事务负载下, 太细分簇降低吞吐量 基于逻辑的数据库 逻辑数据库, 推理数据库, 专家DBMS, 演绎DBMS, 知识库等 知识库 存储常用知识的内涵数据库和存储事实的外延数据库的联合体 内涵数据库 公理(命题)和规则等 外延数据库 基本数据 知识表示 产生式规则 框架(Frames) 语义网络(Semantic Net) 数学逻辑 知识库语言 Prolog Datalog 支持面向对象特征的数据库 对象 封装 持久对象 对象关系 关系对象 数据分布 封装带来了复杂性 水平分段 简单属性和方法上的分段 可以根据定义在该类属性上的谓

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档