2024年大数据面试题试卷.docx

  1. 1、本文档共100页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

大数据面试題及答案

汇总版

?

?

?

?

?

?

?

?

?

?

?

?

?

第1部分选择題

1.1Hadoop选择題

1.1.1HDFS

1.下面哪个程序负责HDFS数据存储?

A.NameNode?

B.Jobtracker?

C.Datanode

D.secondaryNameNode?

E.tasktracker

2.HDFS中的block默认保留几份?

A.3份

B.2份

C.1份

D.4份

3.下列哪个程序一般与NameNode在一种节点启动?

A.SecondaryNameNode

B.DataNode

C.TaskTracker

D.Jobtracker

4.HDFS默认BlockSize(新版本)

A.32MB?

B.64MB

C.128MB

D.256MB

5.Client端上传文献的時候下列哪项对的

A.数据通过NameNode传递給DataNode

B.Client?端将文献切分為?Block,依次上传

C.Client只上传数据到一台DataNode,然后由NameNode负责Block复制工作

6.下面与HDFS类似的框架是?

A.NTFS

B.FAT32

C.GFS

D.EXT3

7.的

8.的

1.1.2集群管理

1.下列哪项一般是集群的最重要瓶颈

A.CPU?

B.网络?

C.磁盘IO??

D.内存

2.有关SecondaryNameNode哪项是对的的?

A.它是NameNode的热备

B.它对内存没有规定

C.它的目的是协助?NameNode?合并编辑曰志,减少?NameNode?启动時间

D.SecondaryNameNode应与NameNode布署到一种节点

3.下列哪项不可以作為集群的管理?

A.Puppet??B.Pdsh??C.ClouderaManager??D.Zookeeper

4.配置机架感知的下面哪项对的

A.假如一种机架出问題,不会影响数据读写

B.写入数据的時候会写到不一样机架的DataNode中

C.MapReduce会根据机架获取离自已比较近的网络数据

5.下列哪个是Hadoop运行的模式

A.单机版?B.伪分布式?C.分布式

6.Cloudera提供哪几种安装CDH的措施

A.Clouderamanager?B.Tarball?C.Yum?D.Rpm

7.

1.2Hbase选择題

1.2.1Hbase基础

1.HBase来源于哪篇博文?C

ATheGoogleFileSystem

BMapReduce

CBigTable

DChubby

2.下面对HBase的描述是錯误的?A

A不是开源的

B是面向列的

C是分布式的

D是一种NoSQL数据库

3.HBase依托()存储底层数据A

AHDFS

BHadoop

CMemory

DMapReduce

4.HBase依赖()提供消息通信机制A

AZookeeper

BChubby

CRPC

DSocket

5.HBase依赖()提供强大的计算能力D

AZookeeper

BChubby

CRPC

DMapReduce

6.MapReduce与HBase的关系,哪些描述是对的的?B、C

A两者不可或缺,MapReduce是HBase可以正常运行的保证

B两者不是强关联关系,没有MapReduce,HBase可以正常运行

CMapReduce可以直接访问HBase

D它們之间没有任何关系

7.下面哪些选项对的描述了HBase的特性?A、B、C、D

A高可靠性

B高性能

C面向列

D可伸缩

8.下面哪些概念是HBase框架中使用的?A、C

AHDFS

BGridFS

CZookeeper

DEXT3

9.?D

1.2.2??Hbase关键

1.LSM含义是?A

A曰志构造合并树

B二叉树

C平衡二叉树

D長平衡二叉树

2.下面对LSM构造描述对的的是?A、C

A次序存储

B直接写硬盘

C需要将数据Flush到磁盘

D是一种有哪些信誉好的足球投注网站平衡树

3.LSM更能保证哪种操作的性能?B

A读

B写

C随机读

D合并

4.LSM的读操作和写操作是独立的?A

A是。

B否。

CLSM并不辨别读和写

DLSM中读写是同一种操作

5.LSM构造的数据首先存储在()。B

A硬盘上

B内存中

C磁盘阵列中

D闪存中

6.HFile数据格式中的Data字段用于()。A

A存储实际的KeyVal

文档评论(0)

159****1748 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档