网站大量收购独家精品文档,联系QQ:2885784924

大规模云存储调研.ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Haystack Storage典型配置 双路四核超线程CPU 48GB 内存 RAID-6控制器,配置256-512M NVRAM 超过12个1TB SATA 硬盘 淘宝网 后端系统存储286亿多个图片 1PB 平均图片大小17.45KB 小于8KB的图片占总数量的61%,总容量的11% 图片访问流量占淘宝网整体流量的90%以上 淘宝网整体系统的拓扑结构 TFS (Taobao File System) 面向互联网服务的分布式文件系统 高可扩展、高可用、高性能 主要针对海量的非结构化数据 为外部提供高可靠和高并发的存储访问 满足了淘宝对小文件存储的需求 TFS技术特点 完全扁平化的数据组织结构,抛弃了传统文件系统的目录结构 在块设备基础上建立自有的文件系统,减少EXT3等文件系统数据碎片带来的性能损耗 单进程管理单块磁盘的方式,摒除RAID5机制 带有HA机制的中央控制节点,在安全稳定和性能复杂度之间取得平衡 尽量缩减元数据大小,将元数据全部加载入内存,提升访问速度 跨机架和IDC的负载均衡和冗余安全策略 完全平滑扩容 TFS总体结构 NameServer TFS的元数据管理中心,主要负责管理自己所在集群的信息,维护DataServer的相关信息,实现DataServer的负载均衡 负责对DataServer 的检查,通过DataServer发送的心跳消息,监控DataServer的加入或者退出,管理所在集群的DataServer信息列表 维护每个DataServer的状态信息,包括总容量,已用容量,当前负载,block数量等,发起对block的新建或删除等操作 维护DataServer上的Block元数据信息,包括Block是否可用,文件数等,读文件的时候负责定位DataServer的位置,写文件的时候负责分配某DataServer的可写block 管理所有block在DataServer中的分布,block的副本复制,以及均衡 DataServer TFS的最终存储设备,最主要的功能就是维护自己拥有的block列表,及block中的文件列表,提供数据的读写。负责具体文件的创建,读写删改 维护和nameserver之间的消息通信,向nameserver发送心跳信息,报告自己的BLOCK列表及状态(如机器Load, 硬盘使用情况) 提供dataserver上BLOCK的创建和删除,并更新nameserver上的block信息 提供block上文件的创建、删除、读写、重命名等 提供DataServer本身的信息查询,例如block及file的信息查询 实现和镜像的数据同步,提供block复制和压缩功能 存储机制 TFS读操作流程 TFS写操作数据流 参考配置 开源站点给出的测试机配置 8核Intel Xeon CPU E5520 @ 2.27GHz 8GB物理内存 当前TFS主要的机型使用SAS 300G×12的磁盘配置 未来将使用1TSATA×12甚至更大的磁盘设备,进一步降低成本 节能型低功耗服务器 淘宝网目前正在和一些服务器厂商合作,由淘宝网定义一些产品规格,厂商为淘宝网定制一批专用的低功耗节能型服务器 低功耗硬件平台方面的改进措施包括 要求厂商应用低功耗的CPU,如Intel ATOM, VIA Nano等 采用低功耗的Chipset、SSD或低功耗的SATA硬盘,并关闭GPU和USB Controller等等 测试阶段,还并未在生产系统中大规模部署 淘宝网节点网络结构的单机柜方案 单机柜方案的机架部署示意图 优酷网视频存储架构 日视频播放量(VV)已经达到1.5亿 每日独立访问用户数量(UV)超过2500万 优酷网占据的浏览时长市场份额已超过50% 采用基于Flash的视频点播技术,需要大量存储和流媒体服务器 服务器和存储设备分布在全国20多个CDN中 网站视频媒体系统拓扑图 优酷网采用的服务器 服务器直连式存储(DAS)架构 服务器主要来自戴尔,还有一部分来自惠普 Dell PowerEdge 1950与PowerEdge 860为主 存储阵列以戴尔MD1000为主 PowerEdge 1950作为Web服务器和流媒体服务器,分别服务于页面系统与视频系统 MD1000, PowerEdge 860以DAS的方式相连,作为一个存储单元 服务器配置 PE1950采用英特尔至强5310处理器,4G内存,两块300G SAS硬盘 PE860采用英特尔至强3060处理器,4G内存,一块80G SATA硬盘 MD1000存储阵列装载有15块750G SATA硬盘 土豆网视频存储系统 2009年扩充了75台宝德PR2012S服务器 处理器XEON E5420 2.50G 1333

文档评论(0)

好文精选 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档