- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大型共享数据库的数据关系模型
E.F.Codd
IBM Research Laboratory,SanJose,California
未来的数据库使用者一定是和数据在机器中的存储(即数据库的内部模式)相隔离的。
而通过提示服务来提供信息是一个不太令人满意的解决方法。 当数据的内部模式表示发生改
变,甚至数据内部表示的多个方面发生改变时, 终端用户和大多数应用程序的活动都不会受
到影响。 因此, 查询、 更新和报告存储信息类型的自然增长和变动都需要在数据表示中表现
出来。
现存的不可推断的、 格式化的数据系统给用户提供了树结构的文件或者更一般的网格模
式的数据。本文在第一部分讨论这些模式的不足之处。并且会介绍一种基于 n 元组关系的
模式,一种数据库关系的正式形式和通用数据子句的概念。 第二部分将讨论一些关系的操作
(不是逻辑层面的),并且把这些操作应用于用户模式上解决冗余和一致性问题。
1 关系模式和一般模式
1.1 简介
这篇文章是关于系统的基本关系原理的应用,这个原理提供了共享大型格式化
数据库的方法。除了 Childs[1] 的文章有介绍外,用于数据库系统的关系的主要应用
还表现在演绎推理型的问 -答系统中。 Levein 和 Maron[2] 提供了大量关于这个领域
的参考资料。
相比之下,这里要解决的问题是一些数据独立性的问题 —— 应用程序和终端活
动之于数据类型增长和数据表示变动的独立性,而数据一致性问题即使在非演绎推
理型系统中也是很棘手的。
在目前流行的非推论性系统中,第一部分要介绍的数据的关系视图(或叫做模
式)在一些方面似乎优于图模式和网格模式 [3,4] 。这种模式提供了一种根据数据的
自然结构来描述描述数据的方式 —— 也就是说,不用为了数据的机器表示而添加其
他的将结构。因此,这种模式为高水准的数据语言提供了基础,而这种数据语言机
制一方面可以达到最大化程序之间的独立性,另一方面也可以最大化数据的机器表
示和组织之间的独立性。
关系模式更高一级的优势在于它构成了关系处理可导性、冗余性和一致性的坚
固基础 —— 这些将在第二部分讨论。另一方面,网络模型产生了一些混淆,尤其是
把连接的源误作为关系的源(见第二部分 连接陷阱“ ”)
最后,关系视图允许对目前格式化数据系统的范围和逻辑限制的更清晰的估算,
并且有在单独的系统内竞争数据表示方式的优点 (从逻辑的观点)。更清楚的这个观
点的示例会在本文中的不同部分中被阐释。 但是支持关系模式的系统实现不会讨论。
1.2 目前系统的数据相关性
最近发展的信息系统中数据描述表的提供是向数据独立性目标 [5,6,7] 靠近的重
要提高。这些表可以使改变数据库中数据表示的某些特征变得更容易些。但是,许
多数据表示特征可以在不逻辑地削弱一些应用程序的情况下被改变的功能仍受到相
当的限制。更进一步,与用户交互的数据模式仍然有一些散乱的代表性特征,特别
word.
是关于数据收集的描述 (如个人名目)。三个仍然需要提高的数据独立性的主要类型
是:排序依赖,索引依赖和存取路径的依赖。在一些系统中这些依赖之间并不是明
确分隔的。
1.2.1 顺序依赖。 数据库中的数据元素可以有很多种存储方式,
文档评论(0)