分布式存储在行业和应用分析.docx

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

?

?

分布式存储在行业和应用分析

?

?

来自twt社区同行交流,欢迎更多同行参与交流

目前分布式存储是否适用大多数行业和应用?随着X86性能的提升和万兆、10万兆网络的发展,分布式存储的瓶颈似乎也越来越少,除了如金融等对IO有特殊要求的行业,分布式存储是否适用在大多数行业和应用中呢?以我目前接触过两个例子来说,一个用的超融合运行大数据分析业务,另一个用的VSAN运行虚拟化,上面分布数据库、中间件等,由于业务没有那么大的压力,所以目前看分布式存储是可以胜任这样的环境的。在实际更多的行业中,还有哪些除了对IO有很高要求的行业以外,不适用分布式存储的应用呢?问题来自社区活动,由会员@潘延晟系统工程师提出,来自twt社区众多同行的分享,欢迎大家参与交流,各抒己见。*“争议”栏目内容来自同行分享的一手体验和观察,仅代表个人观点

@TB洪雪技术总监:

摘一段某金融行业工程师的话,应该也是出自twt的话题:

1,分布式存储没有大量使用,其中一个最大的原因是“软件定义的分布式存储”在可用容量单价方面相比传统存储贵太多了,我们金融企业真心用不起。

2,高可用方面,分布式存储高可用方面对比传统SAN存储有明显差距,无论是单节点重启影响,微码升级影响等各方面在IO静默时间IO跌落幅度和长度方面差距太明显了。

3,集中式架构决定性能可做得更好更极致更低时延。分布式架构天然上性能低时延不如集中式。

4,经历者曾经有几十PB几十套软件定义分布式存储(厂商产品)的运维经验:对比传统集中式存储软件定义的设备故障时的影响持续时间和修复难度要高得多。最怕遇到的是软件bug或是某个软件模块服务异常,这种情况一般很难快速修复,甚至要等几天到周的时间等厂商写hotfix然后打上修复。

@wwwdp西安未来国际项目经理:

分布式存储目前在公安和交通的视频监控应用和视频图像分析、卡口图像(人脸/车辆识别)、大数据分析后端都有广泛的应用。

有些厂家的分布式存储可提供集文件存储、对象存储、块存储、大数据四种存储服务于一身的分布式存储架构,通过横向扩展基础架构实现单系统存储节点扩展至数千个,形成EB级海量存储空间、百亿数据文件管理、千万级IOPS和百GB带宽,并凭借其高效可靠的数据自动修复和自动运维机制,显著降低了存储管理的负担。

分布式存储采用全对称、去中心化分布式架构,将系统的数据和元数据平均的分布到各个节点上,打破了传统系统的元数据集中式存储和管理这一限制,对系统的目录实行分而治之,实现负荷分担、负载均衡;即使系统中出现节点故障,系统也能够通过数据冗余规则以及故障修复迅速进行响应,恢复故障节点存储的数据及元数据信息,提供比传统存储系统更高的可靠性。

分布式存储系统完成系统中各个节点存储资源的组织,对外提供统一API、支持不同协议的存储服务。

分布式存储通过iSCSI协议对外界提供块级别设备接口,采用分布式系统技术、高可用系统技术将大量的存储设备进行集中管理,并支持快照、克隆、卷QoS、精简配置等功能,提高资源利用率,保证关键业务的性能。

分布式存储系统通过HDFSAPI提供大数据服务,使用HDFS可以将存储系统强大的分布式存储能力与Hadoop中MapReduce强大的并行任务处理能力相融合,并结合HDFS相关组件,将数据直接存储,从架构上解决数据爆炸性增长、非结构化数据分析速度缓慢等问题;通过数据共享访问能力的提升与接口的开放,可实现跨平台的数据共享访问,满足不同应用的需求。

分布式存储系统可以根据客户业务需求,灵活的添加或者移除存储节点,从而将数据和应用程序从硬件抽象出来。当向系统中添加节点时,每个节点或者机箱都将聚合增加CPU、内存、缓存、网络等资源,使系统整体性能高于各部分总和,提高吞吐量、容量和IOPS。

分布式存储采用了元数据集群和基于一致性哈希算法的去中心化技术,支持节点动态扩展,不存在性能瓶颈。随着节点数的增加,存储容量和计算能力线性增加,最终给用户提供呈线性递增的吞吐及并发能力。

客户为保证存储空间利用率,分布式存储提供清空回收站与定时删除功能。分布式文件系统回收站和分布式块存储系统回收站数据存储位置及方式不同,因此清空和清理时限的设置要分别进行。清空回收站操作需要慎重处理,在清除数据之前,需要查看回收站,确认没有需要的数据,再进行此项操作。而定时删除功能降低了用户的管理负担,用户可以自由设定定期扫描时间和文件目录/逻辑卷超时时间,系统每隔一段时间在后台运行扫描一次,遍历回收站目录下所有日期目录或卷回收站内卷删除时间,获取当前时间,与日期目录或卷删除时间进行比较,对小于文件目录超时时间的文件/目录/逻辑卷不允许删除,反之,则进行自动删除操作。

分布式存储将零散的存储资源集合起来,提供一个统一命名空间给用户,使用户可通过任

文档评论(0)

134****4822 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档