- 1、本文档共48页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
伪分布式安装配置 实验步骤: 修改配置文件:core-site.xml,hdfs-site.xml,mapred-site.xml 初始化文件系统hadoop namenode -format 启动所有进程start-all.sh 访问web界面,查看Hadoop信息 运行实例 伪分布式安装配置 修改配置文件?core-site.xml? configuration property namehadoop.tmp.dir/name valuefile:/usr/local/hadoop/tmp/value descriptionAbase for other temporary directories./description /property property namefs.defaultFS/name valuehdfs://localhost:9000/value /property /configuration name为fs.defaultFS的值,表示hdfs路径的逻辑名称 hadoop.tmp.dir表示存放临时数据的目录,即包括NameNode的数据,也包括DataNode的数据。该路径任意指定,只要实际存在该文件夹即可? 伪分布式安装配置 修改配置文件?hdfs-site.xml configuration property namedfs.replication/name value1/value /property property name.dir/name valuefile:/usr/local/hadoop/tmp/dfs/name/value /property property namedfs.datanode.data.dir/name valuefile:/usr/local/hadoop/tmp/dfs/data/value /property/configuration dfs.replication表示副本的数量,伪分布式要设置为1 .dir表示本地磁盘目录,是存储fsimage文件的地方 dfs.datanode.data.dir表示本地磁盘目录,HDFS数据存放block的地方 伪分布式安装配置 关于三种Shell命令方式的区别: 1. hadoop fs 2. hadoop dfs 3. hdfs dfs hadoop fs适用于任何不同的文件系统,比如本地文件系统和HDFS文件系统 hadoop dfs只能适用于HDFS文件系统 hdfs dfs跟hadoop dfs的命令作用一样,也只能适用于HDFS文件系统 2.4.1 集群节点类型 2.4.2 集群规模 2.4.3 集群硬件配置 2.4.4 集群网络拓扑 2.4.5 集群的建立与安装 2.4.6 集群基准测试 2.4.7 在云计算环境中使用Hadoop 2.4 Hadoop集群的部署与使用 2.4.1 Hadoop集群中有哪些节点类型 Hadoop框架中最核心的设计是为海量数据提供存储的HDFS和对数据进行计算的MapReduce MapReduce的作业主要包括:(1)从磁盘或从网络读取数据,即IO密集工作;(2)计算数据,即CPU密集工作 Hadoop集群的整体性能取决于CPU、内存、网络以及存储之间的性能平衡。因此运营团队在选择机器配置时要针对不同的工作节点选择合适硬件类型 一个基本的Hadoop集群中的节点主要有 NameNode:负责协调集群中的数据存储 DataNode:存储被拆分的数据块 JobTracker:协调数据计算任务 TaskTracker:负责执行由JobTracker指派的任务 SecondaryNameNode:帮助NameNode收集文件系统运行的状态信息 2.4.2 集群硬件配置 在集群中,大部分的机器设备是作为Datanode和TaskTracker工作的Datanode/TaskTracker的硬件规格可以采用以下方案: 4个磁盘驱动器(单盘1-2T),支持JBOD(Just a Bunch Of Disks,磁盘簇) 2个4核CPU,至少2-2.5GHz 16-24GB内存 千兆以太网 NameNode提供整个HDFS文件系统的NameSpace(命名空间)管理、块管理等所有服务,因此需要更多的RAM,与集群中的数据块数量相对应,并且需要优化RAM的内存通道带宽,采用双通道或三通道以上内存。硬件规格可以采用以下方案: 8
您可能关注的文档
- Chapter-06(死锁)讲述.ppt
- Chap7图讲述.ppt
- chap5频率特性讲述.ppt
- Chapter15Clausestructures,sentencetypesanddiscoursefunctions句子结构,句子类型,话语功能讲述.ppt
- CHAPTER1(new)讲述.ppt
- chapter12疲劳与断裂讲述.ppt
- chapter1概述讲述.ppt
- chapt17核物理简介讲述.ppt
- Chapter02TheStrengthofMachineElement讲述.ppt
- Chapter2计算机英语讲述.ppt
- 四川省元三维大联考高2022级第三次诊断性测试(绵阳三诊B卷)化学含答案.pdf
- 山东省泰山教育联盟2024-2025学年高三下学期4月联考(二模)英语含答案.pdf
- 2025届安徽省江淮十校高三下学期第三次联考(安庆4月联考)含答案(9科试卷).pdf
- 2025年浙江工贸职业技术学院单招职业适应性考试题库及答案1套.docx
- 2025年浙江东方职业技术学院单招职业倾向性考试题库及答案1套.docx
- 2025年河南省鹤壁市单招职业适应性考试题库必考题.docx
- 2025年浙江工商职业技术学院单招职业技能考试题库必考题.docx
- 2025年河南工业贸易职业学院单招职业适应性测试题库必考题.docx
- 《使用HTML5实现响应式布局》第一章-HTML5基础-理论学习资料.pptx
- 《步入移动互联网世界》第三章-移动互联网热门应用-理论学习资料.pptx
最近下载
- 05G514-4(12m实腹式钢吊车梁-重级工作制-A6 A7 Q345钢).pdf VIP
- 露酒生产基础知识与品评-更改后.ppt
- 2025年中国链条行业市场全景评估及投资前景展望报告.docx
- (word)MBTI 性格测试.doc VIP
- 2025年中国烟草总公司福建省公司人员招聘笔试备考题库及答案解析.docx
- 财务报表分析和证-券估值 ,第五版 答案 Financial Statement Analysis and Security Valuation solution SOLUTIONS_MANUAL ,5e.doc
- 2024年全国高中数学联赛初赛试题【16省市】含答案.pdf
- 《《婴幼儿配方乳粉及调制乳粉中7种母乳低聚糖的测定》》.pdf VIP
- 《核电厂工程的设计与设计管理》推荐.ppt
- 水池维修改造施工方案.doc
文档评论(0)