- 1、本文档共26页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
kCloudStorage基于云技术的廉价冗余天文海量数据存储-China-VO.ppt
kCloudStorage- 基于云技术的廉价冗余天文海量数据存储 王锋 季凯帆 邓辉 1昆明理工大学2国家天文台-昆明理工大学天文信息技术联合实验室 2011.11.10 贵阳 1)研究背景 2)当前存储技术的局限 3)天文需求的描述 4)云存储的关键技术 5)可行性与前期实验结果 SUMMARY Background 数据的存储,是天文信息学的基础。 海量数据的保存,本质上并没有很好的解决。 当前常用的技术 DAS, NAS , SAN DAS – 直接存储 NAS – 网络附加存储 SAN – 存储区域网络 DAS vs NAS architecture FC Clients Direct Attached Storage Application Servers Win2k Linux Unix Unix Tape FC Linux Win2k SCSI LAN Application Servers NAS Appliances or NAS Head Ends Generic Generic Win2k Linux Unix LAN SAN architecture Storage is accessed at block level not at file level Very high performances Storage is shared Good management tools Interoperability issues Storage Area Network (SAN) DatabaseServers BlockStorageDevices Fibre Channel SAN Clients LAN 天文数据特点 数据特点 1、存在变长大数据段,例如天文观测图片,数据规格有限 拆分变长数据为定长KV 2、数据总量大,PB级数据量 分布式KV系统 3、更改可能性小 降低分布式事务的严格性,采用不删除 ,更改数据重新分配储存空间的方式规避储存器碎片问题,避免处理空间整理问题,并且保持数据局部顺序性,有利于预读 天文数据需要存储系统既需要文件系统特性也有关系数据库的查询需求 查询需求 1、需要范围查询,例如按照精度纬度查询 B+树实现索引 如果存储按照经纬有序可以采用位图索引 2、顺序存储,顺序读取可能性大 可以采取预读 3、近几年实时处理的要求明显增加 4、有大量的数据导出需求!!!!! 关系型数据库存储天文数据时的问题 问题 1、热备份对性能的影响以及热备的不一致性 2、大数据量 3、磁盘限制导致的QPS瓶颈(SSD) 优雅解决2,3问题往往通过引入高端储存,从而带来高成本 改变 当不优雅的分库分表成为用户解决大数据量的首选办法的时候数据库的革命开始了 如何改变Google引领方向, 放弃高端设备,使用Commodity Device 分布式数据库是必然选择 如何选择索引 如何选择储存 如何实现事务 理想的天文数字库 1、海量 2、分布 3、事务 4、确保一致性 5、可检索查询 6、高速、线速读写 7、随意更换设备 8、任意导出 9、便宜 为天文数据设计量体裁衣 三个技术点 储存(定长,变长记录) 索引(B+,Hash) 事务(行锁,表锁) 云存储的现状 Amazon Amazon的云服务主要包括弹性计算云(EC2)、简单存储服务(S3)、简单数据库服务(SimpleDB)。EC2服务偏向计算,S3服务偏向存储,提供IaaS级别的服务,SImpleDB偏向应用,提供PaaS和SaaS级别的服务。 Google Google当数最大的云计算的使用者。Google有哪些信誉好的足球投注网站引擎就建立在分布在200多个地点、超过100万台服务器的支撑之上,这些设施的数量正在迅猛增长。Google地球、地图、Gmail、Docs等也同样使用了这些基础设施。 三篇重要论文基本描述了这种集群的结构 ”WEB SEARCH FOR A PLANET:THE GOOGLE CLUSTER ARCHITECTURE” “The Google File System” “The Chubby lock service for loosely-coupled distributed systems” 淘宝 淘宝具有一个模仿gfs构架的tfs系统,以及配套的cdn网络形成了国内较大规模的云存储平台,主要提供商家宣传图片的存储,淘宝直接针对这种储存服务收费。 Tencent 同样基于gfs构架,为整个腾讯公司提供文件存储服务 什么是云存储 是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据
您可能关注的文档
- 3.5.1红外测温传感器模块TN901介绍-世界大学城.doc
- 中法兴物流.ppt
- 3.6多路复用技术多路复用的基本概念.ppt
- 3.下列句子中划横线的成语使用正确的一项是A.ppt
- 3.中国近现代社会生活与政治、经济.ppt
- 3.功能需求.doc
- 中煤华昱公司磅房需求分析.doc
- 3.各学科评量量尺之刻度大抵是一致的。.ppt
- 3.基于船舶网络的信息采集性能分析与系统优化.doc
- 中秋节是中国人的三大节日之一,由赏月、烤肉、吃月饼….doc
- 2025-2030中国聚丙烯吸收卫生用品行业市场发展趋势与前景展望战略研究报告.docx
- 商务彩铃合同范本.docx
- 2024-2025学年初中数学七年级下册冀教版(2024)教学设计合集.docx
- 2025-2030中国聚丙烯塑料包装行业市场发展趋势与前景展望战略研究报告.docx
- 2025-2030中国聚丙烯微球行业市场发展趋势与前景展望战略研究报告.docx
- 2025-2030中国聚丙烯手术窗帘行业市场发展趋势与前景展望战略研究报告.docx
- 个人短期劳务合同样本.docx
- 2025-2030中国联合超级合金行业市场现状供需分析及投资评估规划分析研究报告.docx
- 2025-2030中国联名卡市场调研及发展策略研究报告.docx
- 2024-2025学年初中数学六年级下册沪教版(五四学制)(2024)教学设计合集.docx
文档评论(0)