- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第5章数据分级存储
第五章 数据分级存储数据分级存储,是指数据客体存放在不同级别的存储设备(磁盘、磁盘阵列、光盘库、磁带库)中,通过分级存储管理软件实现数据客体在存储设备之间的自动迁移。数据迁移的规则是可以人为控制的,通常是根据数据的访问频率、保留时间、容量、性能要求等因素确定的最佳存储策略。在分级数据存储结构中,磁带库等成本较低的存储资源用来存放访问频率较低的信息,而磁盘或磁盘阵列等成本高、速度快的设备,用来存储经常访问的重要信息。
数据分级存储的工作原理是基于数据访问的局部性。通过将不经常访问的数据自动移到存储层次中较低的层次,释放出较高成本的存储空间给更频繁访问的数据,可以获得更好的总体性价比。
5.1 分级存储的必要性
IT 企业总是要面对增长起来无休无止的数据量。各种应用都在创建越来越大的文件。用户也很少删除数据和存档,这就导致要访问旧一些的文件已经变得非常困难。虼耍壳暗某绷魇枪郝蚋嗟娜砑H欢庵纸饩龇桨覆朔浅8丛雍捅孔镜拇娲肪常唤鲂枰嗟奈ず凸芾恚倚枰嗟慕鹎次帧?/P
事实上,数据具有生命周期,不同的时期有其存在的不同意义。在数据刚生成的数日内,访问频率最高,为企业产生效益和收入,带来的价值也最高;随着时间的推移,访问频率降低,数据的价值也随之下降,低访问频率的数据量远远超过高访问频率的数据量,如果全部用企业级存储产品来存储所有数据,费用非常高,也没有必要。不同生命周期的数据,由于提供给企业不同的服务目的,企业应考虑如何以最低的成本获得最高的价值,而不是采用以往单纯的 购买更多磁盘的解决方式和态度,徒增存储费用和管理复杂程度。
总之,企业业务数据从产生到存储、利用、归档,最后超过存储期限被删除,数据被读取的频率会逐渐下降,数据存储的位置也应该随之变化,以提高存储设备的使用率,降低存储成本。因此有必要进行分级存储,企业在存储其关键业务数据时,采用昂贵的存储技术和方式,如RAID 磁盘、复制、定时拷贝、多级备份等,确保数据高可用;当数据已经不再为企业带来效益时,将这类数据迁移到较便宜的存储介质上;最后,当数据老化到不再被访问时,应考虑将其删除或者迁移,如果是法律要求或政府规定等要保留多年的数据,应将其迁移到近线磁带库或者离线存储介质上进行归档,既安全又节省费用。
同时,信息量的急剧增长,也使存储管理复杂性增加,数据的分级存储也是简化存储管理的需要。通过设定优化的数据迁移规则,能使重要数据和常用数据在最短的时间内访问到,使极少使用的数据备份在廉价的海量存储器中。
5.2 分级存储的优点
数据分级存储之所以重要,是因为它既能最大限度地满足用户需求,又可使存储成本最小化。数据分级存储的优点具体表现在:
1.减少总体存储成本
不经常访问的数据驻留在较低成本的存储器中,可综合发挥磁盘驱动器的性能优势与磁带的成本优势。
2.性能优化
分级存储可使不同性价比的存储设备发挥最大的综合效益。
3.改善数据可用性
分级存储把很少使用的历史数据迁移到辅助存储器中,或归档到离线存储池中,这样就无需反复保存,减少了存储的时间;同时提高了在线数据的可用性,使磁盘的可用空间维持在系统要求的水平上。
4.数据迁移对应用透明
进行分级存储后,数据移动到另外的存储器时,应用程序不需要改变,使数据迁移对应用透明。
分级存储的存储方式
传统的数据存储一般分为在线(On-line)存储及离线(Off-line) 存储两级存储方式。所谓在线存储就是指将数据存放在磁盘系统上,而离线则是指将数据备份到磁带上。但随着数据量的猛增,这种只使用在线和离线两级存储的策略已经不能适应企业的需求。近线存储市场近来成为热点,出现了一些存取速度和价格介于高速磁盘与磁带之间的低端磁盘设备,作为近线存储设备。
5.3.1 在线存储
总体上讲,在线存储多采用高速磁盘阵列等存储设备,存取速度快,当然价格昂贵。在线存储一般采用高端存储系统和技术如:SAN、点对点直连技术、S2A 等。高端存储系统具有一些“高端”属性,比如,高容量、高性能、高可用性、冗余性等,现在存储工程师看到,这些特点已经不再是高端特有的了,许多中端产品也大都采取了这些设计。
SAN 技术的高性能依赖于三个重要领域的性能支持:存储容量、计算能力和传输能力。在传统SAN 存储系统中,存储容量这一环节由于存储介质技术的快速发展已经得到了很好的解决。存储容量通过多磁盘容量的叠加已经能够达到数千TB 的水平。而在计算能力与传输能力两个环节上,传统SAN 却存在很多先天的弱点。最近在高端存储领域出现了两种新技术--点对点直连技术与并行存储技术。具体如下:
点对点直连技术是EMC 近期推出的一种全新的点到点互联架构,在性能方面,由于它采用了点对点对接,消除了总线或交换机方式造成的延迟,专用的数据通道意味着不会出现交换机
文档评论(0)