- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章
什么是“新摩尔定律”:
每18个月全球新增信息量是计算机有史以来全部信息量的总和。
云计算具有哪些特点:
(1)、超大规模(2)、虚拟化(3)、高可靠性(4)、通用性(5)、高可伸缩性、(6)、按需服务(7)、极其廉价
云计算按照服务类型大致分为三类:
将基础设施作为服务(Iaas)、将平台作为服务(Paas)、将软件作为服务(SaaS)
什么是Iaas? 将硬件设备等基础资源封装成服务供用户使用,如AWS的弹性计算云EC2和简单存储服务S3。
什么是Paas?
对资源的抽象层次更进一步,它提供用户应用程序的运行环境,典型的如Google App Engine。
什么是SaaS?
它的针对性更强,它将某些特定应用软件功能封装成服务,如Salesforce公司提供的在线客户关系管理CRM服务。
云计算技术体系结构分为四层:
物理资源层、资源池层、管理中间件层和SOA构建层
(管理中间件层和资源池层是云计算技术的最关键部分)
物理资源层包括计算机、存储器、网络设施、数据库和软件。
资源池层是将大量相同类型的资源构成同构或接近同构的资源池,如计算资源池、数据资源池。构建资源池更多的是物理资源的集成和管理工作。
管理中间件层负责对云计算的资源进行管理,并对众多应用任务进行调度,使资源能够高效、安全地为应用服务。
大数据具有4V+1C的特征:
(1)、数据量大(2)、多样(3)、快速(4)、价值密度低(5)、复杂度
全球企业的IT开销分为三部分:硬件开销、能耗和管理成本。
云计算的优势:
云计算有更低的硬件和网络成本、更低管理成本和电力成本以及更高的资源利用率。
云计算与大数据之间的关系:
大数据是需求,云计算是手段。没有大数据,就不需要云计算。没有云计算就无法处理大数据。
什么是云计算:
长定义:云计算是一种商业计算模型。它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。短定义:云计算是通过网络按需提供可动态伸缩的廉价计算服务。
云计算的管理中间件层:负责资源管理、任务管理、用户管理、和安全管理等工作。
资源管理:负责均衡地使用云资源节点,检测节点的故障并试图恢复或屏蔽它,并对资源的使用情况进行监视统计;
任务管理:负责执行用户或应用提交的任务,包括完成用户任务映像部署和管理、任务调度、任务管理、生命周期管理。
简述亚马逊的云计算:
AWS率先在全球提供了弹性计算云EC2和简单服务存储服务S3,为企业提供计算和存储服务。
亚马逊是最大的服务商,谷歌是最大的云计算技术的使用者。
第二章
Google云计算技术包括:
Google文件系统 GFS、分布式计算编程模型MapReduce、分布式锁服务Chubby、分布式结构化数据表Bigtable。
当前主流分布式文件系统有哪些?各有什么优缺点?
答:RedHat的GFS(Global File System)、IBM的GPFS、Sun的Lustre等。
优缺点:①GFS采用廉价的商品机器构建分布式文件系统,同时将GFS的设计与Google应用的特点紧密结合,简化实现,GFS将容错的任务交给文件系统完成,利用软件的方法解决系统可靠性问题,使存储成本下降;GFS将服务器故障视为正常现象,并采用多种方法、从多个角度,使用不同的容错措施,确保数据存储的安全、保证提供不间断的数据存储服务。
②IBM GPFS并行文件系统软件在设计上不存在任何性能瓶颈,因此GPFS并行文件系统可以充分发挥硬件系统的性能。换句话说,GPFS并行文件系统的性能完全取决于硬件配置的好坏,而文件系统软件本身对性能的影响微乎其微。IBM GPFS并行文件系统与其它并行文件系统之间最大的区别在于GPFS不需要专用的元数据(Meta Data)管理服务器,所有元数据分散在磁盘阵列中,并可以由任何I/O节点管理。这样的设计避免了并行文件系统中最可能产生性能瓶颈的因素——Meta Data Server。
③Lustre文件系统为例,它只对元数据管理器MDS提供容错解决方案,而对于具体的数据存储节点OST来说,则依赖其自身来解决容错的问题。例如,Lustre推荐OST节点采用RAID技术或SAN存储区域网来容错,但由于Lustre自身能提供数据存储的容错,一旦OST发生故障就无法恢复,因此对OST的稳定性就提出了相当高的要求,从而大大增加了存储的成本,而且成本会随着规模的扩大线性增长
GFS容错机制包含:
Master容错:
Master上保存了GFS文件系统的三种元数据。
(1)、命名空间,也就是整个文件系统的目录结构。
(2)、Chunk与文件名的映射表
(3)、Chunk副本的位置信息,每一个Chunk默认有三个副本。
前两种GFS通过操作日志来提供容错功能。第三种直
文档评论(0)