- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
hadoop单元测试方法--使用和增强MRUnit
hadoop单元测试方法--使用和增强MRUnit无花1前言hadoop的mapreduce提交到集群环境中出问题的定位是比较麻烦的,有时需要一遍遍的修改代码和打出日志来排查一个很小的问题,如果数据量大的话调试起来相当耗时间。因此有必要使用良好的单元测试手段来尽早的消除明显的bug(当然仅有单元测试是不够的,毕竟跟集群的运行环境还是不一样的)。然而做mapreduce的单元测试会有一些障碍,比如Map和Reduce一些参数对象是在运行时由hadoop框架传入的,例如OutputCollector、Reporter、eclipse-javadoc:%E2%98%82=swift-mapreduce/F:%5C/m2%5C/repository%5C/org%5C/apache%5C/hadoop%5C/hadoop-core%5C/0.20.2%5C/hadoop-core-0.20.2.jar%3Corg.apache.hadoop.mapred(Reporter.class%E2%98%83Reporter~getInputSplit%E2%98%82InputSplitInputSplit等。这就需要有Mock手段。最初写mapreduce单元测试的时候自己写了几个简单的Mock也基本能满足需要,后来发现MRUnit比我写的要好用所以研究了一下就采用了。MRUnit是专门为hadoop mapreduce写的单元测试框架,API简洁明了,简单实用。但也有一些薄弱的地方,比如不支持MultipleOutputs(很多情况下我们会用MultipleOutputs作为多文件输出,后面将介绍如何增强MRUnit使之支持MultipleOutputs)。2 MRUnitMRUnit针对不同测试对象分别使用以下几种Driver:MapDriver,针对单独的Map测试。ReduceDriver,针对单独的Reduce测试。MapReduceDriver,将Map和Reduce连贯起来测试。PipelineMapReduceDriver,将多个Map-Reduce pair贯串测试。MapDriver单独测试Map的例子,假设我们要计算一个卖家的平均发货速度。Map将搜集每一次发货的时间间隔。针对Map的测试,//这是被测试的Map private Map mapper; private MapDriverLongWritable, Text, Text, TimeInfo mapDriver; @Before public void setUp() { mapper = new Map(); mapDriver = new MapDriverLongWritable, Text, Text, TimeInfo(); }@Test public void testMap_timeFormat2() { String sellerId = 444; //模拟输入一行(withInput),假设从这行数据中我们可以获得卖家(sellerId)//某一次时间间隔为10小时.//我们期望它输出sellerId为key,value为代表1次10小时的TimeInfo对象。//(withOutput)//如果输入数据经过Map计算后为期望的结果,那么测试通过。Text mapInputValue = new Text(……); mapDriver.withMapper(mapper).withInput(null, mapInputValue).withOutput(new Text(sellerId), new TimeInfo(1, 10)).runTest(); }ReduceDriver针对Reduce的单独测试,还是这个例子。Reduce为根据Map或Combiner输出的n次时间间隔的总和来计算平均时间。 private Reduce reducer;@Before public void setUp() { reducer = new Reduce(); reduceDriver = new ReduceDriverText, TimeInfo, Text, LongWritable(reducer); } @Test public void testReduce () { ListTimeInfo values = new ArrayListTimeInfo(); values.add(new TimeInfo(1, 3));//一次3小时 values.add(new TimeInfo(2, 5));//两次总共5小时 values.add(new TimeInfo(3, 7));//三次总共7小时//values作为444这个卖
您可能关注的文档
- In On Under不错.doc
- 第二讲 增补译法(西班牙语翻译).doc
- 小学英语六年级上册单元检测题Recycle 1doc.doc
- RFIDMuxDemo用户手册v1.0.doc
- 2013新pep四年级上英语recycle2教案.docx
- 金盆小学英语三年级下册Recycle 杨秀香.doc
- 英语答案Unit 5.doc
- 四年级英语下册Unit3-Recycle1测试题(新版).doc
- 三年级英语上册Recycle_2教案3.doc
- 通信原理中中英缩写对照表.doc
- 4.1 陆地水体及其关系 课件高二上学期地理中图版(2019)选择性必修一.pptx
- 混凝土结构与砌体结构设计习题集 .pdf
- 统编版语文四年级下册 22.古诗三首 课件(共50张PPT).pptx
- 青海2024行测笔试真题及答案 .pdf
- 2.1 充分发挥市场在资源配置中的决定性作用 课件-高中政治统编版必修二经济与社会.pptx
- 27.巨人的花园 课件(共58张PPT).pptx
- 统编版语文一年级下册5 树和喜鹊 第1课时 课件(共37张PPT).pptx
- 2.1 充分发挥市场在资源配置中的决定性作用 课件政治一轮复习统编版必修二经济与社会.pptx
- 贵港市平南县2024届小升初考试语文试卷含答案 .pdf
- 小学期末考试质量分析 .pdf
最近下载
- 2025年高考地理二轮复习非选择题强化训练(课件).pptx VIP
- (二模)2025年广州市普通高中毕业班综合测试(二)数学试卷(含答案详解).pdf
- 14J938 抗爆、泄爆图集标准.docx VIP
- 降低CRRT治疗非计划下机率.pptx VIP
- 《中国心力衰竭诊断和治疗指南2024》解读(下).pptx
- 《预检分诊》课件.pptx VIP
- 2024年河南省政务服务办事员职业技能竞赛考试题库-下(判断、简答题汇总).docx
- 2025年部编版语文六年级毕业复习知识点.pdf VIP
- 2025年政务服务办事员技能大赛理论考试题库600题(含答案).docx
- 14J938抗爆泄爆图集标准.docx VIP
文档评论(0)