- 1、本文档共63页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * Chapter 2 * 扩展多路归并以排序更大的关系 假设: ? 磁盘块大小是B字节 ? 缓冲区块可用的主存是M字节 ? 记录占R字节 这样:主存中可用的缓冲区数是M/B. 在第二阶段:其中的一个缓冲区用于存放输出块, 其余的缓冲区都用来供排序子表之一使用。 * Chapter 2 * 在阶段一创建的排序子表数是(M/B)?1, 每填满一次主存,排序 M/R 个记录, 这样,可排序的记录的总数是 (M/B)((M/B) ?1), 或近似位 M 2 / RB 个记录。 例:M=50 000 000 B= 4096 R=100 这样能够排序的记录数达到: M 2 / RB =61亿(占据0.6TB(600GB)) * Chapter 2 * 如需要排序更多的记录,可以增加一个第三趟, 使用两阶段多路归并法来排序若干个包含M2/RB个记录的记录组,将它们变成排序子表。 然后,在第三阶段,在最终的多路归并中,把多达(M/B)?1个这样的子表归并起来。 第三阶段让我们能排序大约 M3/RB2个记录,占据M3/R2个块。 * Chapter 2 * 2.4 Accessing Hard Disk Quickly Organizing Data by Cylinders Using Multiple Disks Mirroring Disks Disk Scheduling and the Elevator Algorithm Prefetching and Large-Scale Buffering * Chapter 2 * 2.4.1 Organizing Data by Cylinders Disk Access Time = Seek Time + Rotational Delay +Transfer Time Megatron747 6.5 ms + 7.8 ms + 0.5ms Sorting 10,000,000 records by Two-Phase, Multiway Merge takes 250 minutes Blocks distributed randomly on disk. The organization of blocks by cylinders. First phase 2.15*2 minutes + Second phase 125 minutes 12 800 blocks Transfer Time :6.4*20次=128 second= 2.15m * Chapter 2 * 2.4.2 Using Multiple Disks Megatron 747 ( four platters with eight surfaces) Megatron 737 ( one platter with two surfaces) X 4 Two-Phase, Multiway Merge-Sort Phase 1: Speed-up 4 times From 4 disks read 3 200 blocks 6.4/4 = 1.6 second First phase 2.15*2 minutes/ 4 = 1min. Phase 2: Speed-up 2~3 times 1 hour * Chapter 2 * 2.4.3 Mirroring Disks Enhance reliability Speed up reading but not writing * Chapter 2 * 2.4.4 Disk Scheduling and the Elevator Algorithm Cylinder of Request First time available 1000 0 3000 0 7000 0 2000 20 8000
文档评论(0)