Hadoop学习总结之五:Hadoop的运行痕迹.docVIP

Hadoop学习总结之五:Hadoop的运行痕迹.doc

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
在使用hadoop的时候,可能遇到各种各样的问题,然而由于hadoop的运行机制比较复杂,因而出现了问题的时候比较难于发现问题。 本文欲通过某种方式跟踪Hadoop的运行痕迹,方便出现问题的时候可以通过这些痕迹来解决问题。 一、环境的搭建 为了能够跟踪这些运行的痕迹,我们需要搭建一个特殊的环境,从而可以一步步的查看上一节提到的一些关键步骤所引起的变化。 我们首先搭建一个拥有一个NameNode(namenode:04),三个DataNode(datanode01:05, datanode02:06, datanode03:07)的Hadoop环境,其中SecondaryNameNode和NameNode运行在同一台机器上。 对于这四台机器上的Hadoop,我们需要进行如下相同的配置: NameNode,SeondaryNameNode,JobTracker都应该运行在namenode:04机器上 DataNode,TaskTracker,以及生成的Map和Reduce的Task JVM应该运行在datanode01, datanode02, datanode03上 数据共有三份备份 HDFS以及Map-Reduce运行的数据放在/data/hadoop/dir/tmp文件夹下 property ? name/name ? valuehdfs://04:9000/value /property property ? namemapred.job.tracker/name ? value04:9001/value /property property ? namedfs.replication/name ? value3/value /property property ? namehadoop.tmp.dir/name ? value/data/hadoopdir/tmp/value ? descriptionA base for other temporary directories./description /property 然而由于Map-Reduce过程相对复杂,为了能够对Map和Reduce的Task JVM进行远程的调试,从而能一步一步观察,因而对NameNode和三个DataNode有一些不同的配置: 对于NameNode: 设置mapred.job.reuse.jvm.num.tasks为-1,使得多个运行于同一个DataNode上的Map和Reduce的Task共用同一个JVM,从而方便对此JVM进行远程调试,并且不会因为多个Task JVM监听同一个远程调试端口而发生冲突 对于mapred.tasktracker.map.tasks.maximum和mapred.tasktracker.reduce.tasks.maximum的配置以DataNode上的为准 设置io.sort.mb为1M(原来为100M),是为了在Map阶段让内存中的map output尽快的spill到文件中来,从而我们可以观察map的输出 设置mapred.child.java.opts的时候,即设置Task JVM的运行参数,添加远程调试监听端口8333 ? property ??? namemapred.job.reuse.jvm.num.tasks/name ??? value-1/value ??? description/description ? /property ? property ??? namemapred.tasktracker.map.tasks.maximum/name ??? value1/value ??? description/description ? /property ? property ??? namemapred.tasktracker.reduce.tasks.maximum/name ??? value1/value ??? description/description ? /property ? property ??? nameio.sort.mb/name ??? value1/value ??? description/description ? /property ? property ??? namemapred.child.java.opts/name ??? value-Xmx200m -agentlib:jdwp=transport=dt_socket,address=8883,server=y,suspend=y/value ??? description/description ? /property ? property ??? namemap

文档评论(0)

max + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档