- 1、本文档共7页,其中可免费阅读3页,需付费100金币后方可阅读剩余内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
参数运行内部原理当开始运算并产生中间数据时其产生的中间结果并非直接就简单的写入磁盘这中间的过程比较复杂并且利用到了内存来进行已经产生的部分结果的缓存并在内存中进行一些预排序来优化整个的性能如上图所示每一个都会对应存在一个内存即上图的会将已经产生的部分结果先写入到该中这个默认是大小但是这个大小是可以根据提交时的参数设定来调整的该参数即为当的产生数据非常大时并且把调大那么在整个计算过程中的次数就势必会降低对磁盘的操作就会变少如果的瓶颈在磁盘上这样调整就会大大提高的计算性能做和的内存结构如下如所示在运
1 Map side tuning参数
1.1 MapTask运行内部原理
当map task开始运算,并产生中间数据时,其产生的中间结果并非直接就简单的写入磁盘。这中间的过程比较复杂,并且利用到了内存buffer来进行已经产生的部分结果的缓存,并在内存buffer中进行一些预排序来优化整个map的性能。如上图所示,每一个map都会对应存在一个内存buffer(MapOutputBuffer,即上图的buffer in memory),map会将已经产生的部分结果先写入到该buffer中,这个buffer默认是100MB大小,但是这个大小是可以根据job提交时的参数设定来调整的,该参数即为:i
您可能关注的文档
- 《中文核心期刊要目总览》(2008年版)详表如下 name pykm name1 .doc
- 《中国早期人类的代表——北京人》教学课件.ppt
- 《资产交易合同》附件一 附件一: 标的基本情况介绍 一、标的基本情况 .doc
- 《中控蓝海》第21期 - 中控科技.pdf
- 【3-3三角形的边角关系】.doc
- 【excel表格的基本操作】excel表格的35招必学秘技【excel表格的基本 .doc
- 【ヴィトン n60011】 大欢迎 hot!sale ヴィトン n60011 コピー - ヴィトン .pdf
- 【ヴィトン バッグ】 高い素材 ヴィトン バッグ サイズ、ルイヴィトン コピー .pdf
- 【ヴィトン 小钱】 2016-2017年春夏新作の ヴィトン 小钱 入れ - ルイ .pdf
- 【クロム ハーツ】 100本物保证! クロム ハーツ ブレス - クロム ハーツ .pdf
文档评论(0)