压缩对Hadoop性能影响研究-中国云计算.PDF

压缩对Hadoop性能影响研究-中国云计算.PDF

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
压缩对Hadoop性能影响研究-中国云计算

中国科技论文在线 压缩对 Hadoop 性能影响研究 ** 向丽辉,缪力 (湖南大学信息科学与工程学院,长沙 410086) 5 摘要:压缩是 I/O 调优的一个重要方法,它能减少 I/O 的计算负载,从而提高 I/O 的性能。 当今,磁盘 I/O 的发展速度永远赶不上有着摩尔定律发展的 CPU 速度,所以 I/O 常常成为 数据处理的瓶颈。在 Hadoop 中,如何使用压缩来进行I/O 调优还未被完全研究。本文通过 实验,得出了一个压缩使用策略来帮助Hadoop 的使用者来确定何时何地使用压缩以及使用 何种压缩。基于这个策略,有些 Hadoop 应用在合理使用压缩后能提高达 65%的效率。 10 关键词:Hadoop;MapReduce;I/O;压缩 中图分类号:TP302.7 Compression on Hadoop:A Case Study of Improving I/O Performance on Hadoop 15 XIANG Lihui, MIAO Li (Computer Science and Technology School,HuNan University, ChangSha 410086) Abstract: Compression is an important method to optimize I/O , it can reduce I/O load to improve I/O performance .Now, the development of disk I/O speed never catch up with that of CPU with a Moores law ,so the I/O often become the bottleneck of data processing. In Hadoop, how to use 20 compression to optimize I/O hast been studied fully. In this paper, a compression-using policies is worked out to help the Hadoop users to determine when and where to use compression and use which one. Based the policy, some Hadoop applications with avalibable compression can improve the efficiency to 65%. Keywords: Hadoop; Mapreduce; I/O; Compression 25 0 引言 随着数据的高速增长,作为海量数据处理的代表性技术,MapReduce[1]思想越来越得到 重视。Hadoop 作为 MapReduce 的一个开源实现,具有良好的扩展性和容错性,得到越来越 广泛的研究与应用。然而,Hadoop 在数据处理性能和效率方面与并行数据库相差甚远:根 30 据一项实验表明,在 100 节点规模上处理简单查询,DBMS-X 平均比 Hadoop 快了 3.2 倍, Vertica 平均比 Hadoop 快了 2.3 倍[2] 。如果处理复杂的关联查询,数据库的效率比 Hadoop

文档评论(0)

wumanduo11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档