- 1、本文档共29页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本章说明12.1文件的基本概念12.2顺序文件12.3索引文件.ppt
学习目标 熟悉各类文件的结构和特点,以及及其适用场合 重点和难点 本章重点在于了解各种文件的结构特点及其适用场合 知识点 顺序文件、索引、索引顺序文件、VSAM文件、直接存取文件(散列文件)、多关键字文件 学习指南 文件是外存的集合结构,因此和查找表类似,为了提高对文件进行操作的效率,也存在一个数据的组织问题。因此在学习本章的过程中同样应着重了解文件的各种表示方法及其特点。 12.1 文件的基本概念 12.1 文件的基本概念 12.1 文件的基本概念 12.2 顺序文件 12.3 索引文件 12.3 索引文件 12.3 索引文件 12.4 ISAM文件和VSAM文件 ISAM文件(索引顺序存取法) 是一种专为磁盘存取而设计的文件组织方式。 由于磁盘是以盘组、柱面和磁道三级地址存取的设备,则可对磁盘上的数据文件建立盘组、柱面和磁道三级索引。 文件的记录在同一盘组上存放时,应先集中放在一个柱面上,然后再顺序存放在相邻的柱面上,对同一柱面,则应按盘面的次序顺序存放。用这种方法建立起来的索引文件称为ISAM文件。 包括:索引区、数据基本区、数据溢出区。 12.4 ISAM文件和VSAM文件 ISAM文件的检索 查主索引(驻内存),将相应柱面索引(在其柱面上)调用内存。 查柱面索引,将磁道索引(一般放在第0道上)调入内存; 查磁道索引,将本磁道上的所有记录送入内存; 顺序对这一组记录查找。 ISAM文件的插入 定位应插入的磁道; 按关键字顺序插入新纪录,将同一磁道上最后一个记录移至溢出区; 同时修改磁道索引项。 12.4 ISAM文件和VSAM文件 ISAM文件的删除 找到待删除的记录,在其存储位置上作删除标记即可,而不需要移动记录或改变指针。 ISAM文件的整理 经过多次的增删后,文件的结构可能变得很不合理。此时,大量得记录进入溢出区,而基本区中又浪费很多空间。因此,通常需要周期地整理ISAM文件。 把记录读入内存,重新排列,复制成一个新的ISAM文件,填满基本区而空出溢出区。 12.4 ISAM文件和VSAM文件 VSAM(虚拟存储存取方法) 利用了操作系统的虚拟存储器的功能,给用户提供方便。 对用户来说,存储记录时不需要考虑记录的具体存储位置,也不需要考虑何时执行对外存的读写命令。 VSAM文件结构 三部分组成:索引集、顺序集和数据集。 12.4 ISAM文件和VSAM文件 12.4 ISAM文件和VSAM文件 VSAM文件的检索 在控制区间上存取一个记录时,需从控制区间两端出发,同时向中间扫描。 VSAM文件的插入 新记录插入到相应的控制区间内,移动其它记录,保持有序; 控制区已满时,要进行控制区的分裂,即将一半的记录移入另一个控制区间,并修改顺序集中相应索引。 VSAM文件的删除 删除记录时,需将同一控制区间中记录关键字较大的记录向前移动,把空间留给以后插入的新记录。 控制区间变空时,则需修改顺序集中相应的索引项。 12.4 ISAM文件和VSAM文件 VSAM文件缺点 占有较多的存储空间,一般只能保持约76%的存储空间利用率。 VSAM文件优点 动态地分配和释放存储空间,不需要对文件进行重组。 能较快地对插入的记录进行查找,查找一个后插入的记录和查找一个原有记录的时间是相同的。 12.5 直接存取文件(散列文件) 12.5 直接存取文件 主关键字文件的特点 在对文件进行检索操作时,不仅对主关键字进行简单询问,还经常需要对次关键字进行其他类型的询问检索。因此,对多关键字文件,尚需建立一系列的次关键字索引。 次关键字索引与主关键字索引所不同 每个索引项应包含次关键字、具有同一次关键字的多个记录的主关键字或或物理记录号。 多重表文件和倒排文件是两种多关键字文件的组织方法。 多重表文件(Multilist file)的特点 记录按主关键字的顺序构成一个串联文件,建立主关键字的索引(称为主索引); 对每个次关键字项建立次关键字索引(称为次索引),所有具有同一次关键字的记录构成一个链表。 主索引为非稠密索引(一组记录建立一个索引项),次索引为稠密索引(每个记录建立一个索引项)。每个索引包括次关键字、头指针和链表长度。 在多重表中插入一个新记录是很容易的,只要修改指针,将记录插在链表的头指针之后。但是,要删去一个记录却很繁琐,需要在每个次关键字的链表中删去该记录。 12.6.2 倒排文件 倒排文件(Inverted file)和多重表文件的区别 次关键字索引的结构不同。 倒排表 倒排文件中的次关键字索引。 在倒排表的索引项中没有头指针和链表长度项,而直接用一项存放具有同一关键字的所有记录的物理记录号或主关键字。 本章小结 顺序文件 文件中记录的物理顺序和逻辑顺序一致。 对顺序存储器上的顺序文件只能进行顺序存
文档评论(0)