- 1、本文档共25页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十章__文件
文件 在现代计算机的应用领域中,数据处理是一个重要方面。数据处理是对各种类型的大批量的数据进行收集、存储、排序、检索、计算、修改、输出等分析和加工处理的过程。例如,用计算机进行企业管理、财务工资管理、仓库物资管理、情报检索、统计报表等都涉及到数据存放到外存储器上。有时,为了长期保存原始数据和加工处理过的数据,也需要将这些数据以文件的形式存放在外存上。学完本章读者应能掌握文件的概念、逻辑特性、物理结构和基本操作。 文件的基本概念 与文件有关的基本术语有以下几个: 数据项:数据项是文件中可使用的不可分的最小数据单位。一个数据项由若干个字符或数字组成,它代表某一事物的一种属性。数据项又称为数据域。例如,个人书库中的登录号、书号、书名、作者、出版社和价格等等都是数据项。 记录:记录是由一个或多个数据项根据一定的目的而组成的数据项集合。例如,由登录号、书号、书名、作者、出版社和价格等数据项组成的集合是一个职工记录。 文件:文件是大量性质相同的记录组成的集合。 文件分操作系统文件和数据库文件; 文件又逻辑结构(记录间的逻辑关系)和物理结构(存储方法)。 关键字:是能够区别文件中各记录的域。通常,把能唯一标识一个记录的关键字称为主关键字;而那些不能唯一标识一个记录的关键字称为次关键字;由两个以上关键字组成的关键字称为复合关键字。 在表12-1所给出的文件中,各个记录的结构相同,信息长度相同,因而我们将这样的记录称为定长记录。由定长记录组成的文件称为定长记录文件。除了定长记录文件之外,还有不定长记录文件。例如,在学生学籍管理文件中,不同的年级,或者不同专业的学生,所修的课程数和课程名称都不一样。这样,反映各个学生的学科成绩的记录长度和结构就不相同,这类记录称为不定长记录。由不定长记录组成的文件叫做不定长记录文件。 顺序文件 顺序文件是物理结构最简单的文件,也是数据处理历史上最早使用的文件结构。顺序文件的各个记录按输入的先后次序存放在外存中的连续存储区。为了便于检索和修改文件,文件中的记录通常按关键字的大小次序排列,成为按关键字排序的顺序文件。表12-1所示的文件是按关键字考号排序的文件,它存放到外存的连续存储区后便得到一个按关键字排序的顺序文件。 顺序文件的基本优点是在连续存取时速度较快。例如,如果文件中的第i个记录刚被存取过,而下一个要存取的记录就是第i+1个记录,则此次存取将会很快完成。磁带是比较适用于这种应用的外存设备。存放于磁带上的文件也只能是顺序文件,这是由磁带的物理特性决定的。存放于磁盘上的文件,既可以是顺序文件,也可以是索引结构或其它结构类型的文件。 索引文件 顺序文件的查询速度很慢。采用索引文件可以提高检索效率。 索引用来表示关键字与相应记录的存储地址之间的对应关系。换言之,索引指出了记录在存储器中的存储地址。设记录Ri的关键字为Ki,Ri在外存中的存储地址为Ai,则(Ki,Ai)称为记录Ri的索引项。 索引表(简称索引)是索引项的集合。 如果文件中的每个记录都有一个索引项,则这样的索引称为稠密索引。如果多个记录只有一个索引项,则这样的索引称为非稠密索引。带有索引的文件称为索引文件。索引也称为目录。 索引顺序文件 在实际应用中,索引顺序文件是被经常采用的一种文件结构。它是在顺序文件的基础上,用增加索引的办法而形成的。文件中的记录按关键字大小顺序存放在磁盘的连续或相邻的存储区中。由于记录按关键字排序,因此不必为每一个记录设立一个索引项,而把文件划分为若干个记录块,只为每块中关键字最大(或最小)的记录设置一个索引项。这种组织文件的方法称为索引顺序存取法ISAM(Indexed Sequential Access Method),用这种方法建立起来的索引文件称为ISAM文件,它是一种专为磁盘存取设计的文件组织方式。 由于磁盘是以盘组、柱面和磁道三级地址存取的设备,则可对磁盘上的数据文件建立盘组、柱面和磁道三级索引。文件的记录在同一盘组上存放时,应先集中放在一个柱面上,然后再顺序存放在相邻的柱面上,对同一柱面,则应按盘面的次序顺序存放。例如图12-8为存放在一个磁盘组上的ISAM文件。每个柱面建立一个磁道索引,每个磁道索引项由两部分组成:基本索引项和溢出索引项,如图12-9所示,每一部分都包括关键字和指针两项,前者表示该磁道中最大关键字,后者指示该磁道中第一个记录的位置,柱面索引的每一个索引项也由关键字和指针两部分组成,前者表示该柱面中最末一个记录的关键字(最大关键字),后者指示该柱面上的磁道索引位置。柱面索引存放在某个柱面上,若柱面索引较大,占多个磁道时,则可建立柱面索引的索引——主索引。 在ISAM文件上检索记录时,先从主索引出发找到相应的柱面索引,再从柱面索引找到记录所在柱面的磁道索引,最
文档评论(0)