- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Apache Hadoop 3.0.0-alpha1正式发布及其更新介绍
Spark大数据博客 -
Apache Hadoop 3.0.0-alpha1正式发布及其更新介绍
Apache Hadoop
3.0.0-alpha1相对于hadoop-2.x来说包含了许多重要的改进。这里介绍的是Hadoop 3.0.0的alpha
版本,主要是便于检测和收集应用开发人员和其他用户的使用反馈。因为是alpha版本,所以本版
本的API稳定性和质量没有保证,如果需要在正式开发中使用,请耐心等待稳定版的发布吧。
本文将对Hadoop 3.0.0重要的改进进行介绍。
Java最低版本要求从Java7 更改成Java8
所有的Hadoop JARs都是针对Java 8 编译的。仍在使用Java 7 或更低版本的用户必须升级至Java
8。
HDFS支持纠删码(Erasure Coding)
与副本相比纠删码是一种更节省空间的数据持久化存储方法。标准编码(比如Reed-
Solomon(10,4))会有
1.4 倍的空间开销;然而HDFS副本则会有3倍的空间开销。因为纠删码额外开销主要是在重建和
执行远程读,它传统用于存储冷数据,即不经常访问的数据。当部署这个新特性时用户应该考虑
纠删码的网络和CPU
开销。更多关于HDFS的纠删码可以参见/docs/r3.0.0-alpha1/hadoop-
project-dist/hadoop-hdfs/HDFSErasureCoding.html或者直接阅读本博客 《Hadoop
3.0纠删码(Erasure Coding):节省一半存储空间》的相关介绍。
YARN Timeline Service v.2
本版本引入了Yarn时间抽服务v.2,主要用于解决2大挑战:改善时间轴服务的可伸缩性和可
靠性,通过引入流和聚合增强可用性。
YARN Timeline Service v.2 alpha
1可以让用户和开发者测试以及反馈,以便使得它可以替换现在的Timeline Service
v.1.x。请在测试环境中使用。更多关于YARN Timeline Service
v.2的知识请参见/docs/r3.0.0-alpha1/hadoop-yarn/hadoop-yarn-
site/TimelineServiceV2.html
Shell脚本重写
Hadoop的Shell脚本被重写解决了之前很多长期存在的bug,并且引入了一些新的特性。绝大
部分都保持兼容性,不过仍有些变化可能使得现有的安装不能正常运行。不兼容的改变可以参见
HADOOP-9902。更多内容请参见Unix Shell Guide
文档。即使你是资深用户,也建议看下这个文档,因为其描述了许多新的功能,特别是与可扩展
1 / 3
Apache Hadoop 3.0.0-alpha1正式发布及其更新介绍
Spark大数据博客 -
性有关的功能。
MapReduce任务级本地优化
MapReduce添加了Map输出collector的本地实现。对于shuffle密集型的作业来说,这将会有30%
以上的性能提升。更多内容请参见MAPREDUCE-2841
如果想及时了
解Spark、Hadoop或者Hbase相关的文章,欢迎关注微信公共帐号:iteblog_hadoop
支持多于2个的NameNodes
最初的HDFS NameNode high-availability实现仅仅提供了一个active
NameNode和一个Standby NameNode;并且通过将编辑日志复制到三个JournalNodes上,这种
架构能够容忍系统中的任何一个节点的失败。然而,一些部署需要更高的容错度。我们可以通过
这个新特性来实现,其允许用户运行多个Standby NameNode。比如通过配置三个NameNode和
五个JournalNodes,这个系统可以容忍2个节点的故障,而不是仅仅一个节点。HDFS high-
availability
文档已经对这些信息进行了更新,我们可以阅读这篇文档了解如何配置多于2个NameNodes。
多个服务的默认端口被改变
在此之前,多个Hadoop服务的默认
您可能关注的文档
- 2018年第4期(总第122期).doc
- 2018年青大附院公开招聘合同制工作人员笔试成绩.PDF
- 2018第1期(总第62期).DOC
- 2020 年汉诺威物流展.PDF
- 2、保修及服务范围…1.PDF
- AM26LV31 低压、高速四路差分线路驱动器.PDF
- APPLE PAY 条款及细则.PDF
- Apple Watch的核心部件仍made in China.PDF
- BT 系列蠕动泵.PDF
- IIHS发布71款年度安全车:日系52车.PDF
- [中央]2023年中国电子学会招聘应届生笔试历年参考题库附带答案详解.docx
- [吉安]2023年江西吉安市青原区总工会招聘协理员笔试历年参考题库附带答案详解.docx
- [中央]中华预防医学会科普信息部工作人员招聘笔试历年参考题库附带答案详解.docx
- [保定]河北保定市第二医院招聘工作人员49人笔试历年参考题库附带答案详解.docx
- [南通]江苏南通市崇川区人民法院招聘专职人民调解员10人笔试历年参考题库附带答案详解.docx
- [厦门]2023年福建厦门市机关事务管理局非在编工作人员招聘笔试历年参考题库附带答案详解.docx
- [三明]2023年福建三明市尤溪县招聘小学幼儿园新任教师79人笔试历年参考题库附带答案详解.docx
- [哈尔滨]2023年黑龙江哈尔滨市木兰县调配事业单位工作人员笔试历年参考题库附带答案详解.docx
- [上海]2023年上海市气象局所属事业单位招聘笔试历年参考题库附带答案详解.docx
- [台州]2023年浙江台州椒江区招聘中小学教师40人笔试历年参考题库附带答案详解.docx
文档评论(0)