网站大量收购独家精品文档,联系QQ:2885784924

1 map side tuning参数.doc

  1. 1、本文档共7页,其中可免费阅读3页,需付费100金币后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
参数运行内部原理当开始运算并产生中间数据时其产生的中间结果并非直接就简单的写入磁盘这中间的过程比较复杂并且利用到了内存来进行已经产生的部分结果的缓存并在内存中进行一些预排序来优化整个的性能如上图所示每一个都会对应存在一个内存即上图的会将已经产生的部分结果先写入到该中这个默认是大小但是这个大小是可以根据提交时的参数设定来调整的该参数即为当的产生数据非常大时并且把调大那么在整个计算过程中的次数就势必会降低对磁盘的操作就会变少如果的瓶颈在磁盘上这样调整就会大大提高的计算性能做和的内存结构如下如所示在运

1 Map side tuning参数 1.1 MapTask运行内部原理 当map task开始运算,并产生中间数据时,其产生的中间结果并非直接就简单的写入磁盘。这中间的过程比较复杂,并且利用到了内存buffer来进行已经产生的部分结果的缓存,并在内存buffer中进行一些预排序来优化整个map的性能。如上图所示,每一个map都会对应存在一个内存buffer(MapOutputBuffer,即上图的buffer in memory),map会将已经产生的部分结果先写入到该buffer中,这个buffer默认是100MB大小,但是这个大小是可以根据job提交时的参数设定来调整的,该参数即为:i

文档评论(0)

yanpizhuang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档