《大数据平台搭建与配置管理》期中试题试卷及答案.docxVIP

《大数据平台搭建与配置管理》期中试题试卷及答案.docx

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

大数据平台搭建与配置管理

第PAGE1页共NUMPAGES4页

《大数据平台搭建与配置管理》期中试题

期中试题(闭卷A)

题号

成绩

满分

30

20

20

30

100

得分

【本套试卷共有4大题,计66小题】

一、选择题(20题,每题1.5分,共30分)

1、Client端上传文件的时候下列正确的是()。

A.数据经过NameNode传给DataNode

B.Client只上传数据到一台DataNode

C.Client端将文件切分为Block,依次上传

D.NameNode负责Block复制工作

2、HDFS的NameNode负责管理文件系统的命名空间,将所有的文件和文件夹的元数据保存在一个文件系统树中,这些信息也会在硬盘上保存成一下文件()。

A.日志

B.命名空间镜像

C.两者都是

D.以上都不是

3、MapReduce框架提供了一种序列化键/值对的方法,支持这种序列化的类能够在Map和Reduce过程中充当键或值,以下说法错误的是?()

A.实现Writable接口的类是值

B.实现WritableComparable接口的类可以是值或键

C.Hadoop的基本类型Text并不实现WritableComparable接口

D.键和值的数据类型可以超出Hadoop自身支持的基本类型

4、对MapReduce的体系结构,以下说法不正确的是()

A.分布式编程架构

B.以数据为中心,更看重吞吐率

C.分而治之的思想

D.将一个任务合并成多个子任务

5、在创建Linux分区时,一定要创建()两个分区。

A.FAT/NTFS

B.FAT/SWAP

C.NTFS/SWAP

D.SWAP/根分区

6、下面哪个命令是用来定义shell的全局变量()。

A.exportfs

B.alias

C.exports

D.export

7、ZooKeeper可以实现()。

A.高吞吐量和低延迟数量

B.高吞吐量和高延迟数量

C.低吞吐量和低延迟数量

D.低吞吐量和高延迟数量

8、分布式应用正在运行的一组系统称为()。

A.集群

B.分布式系统

C.单元

D.组

9、查询速度的提升是以额外的()为代价的。

A.创建索引

B.创建索引和存储索引

C.删除索引

D.存储索引

10、Hive的元数据不能够存储在哪些位置?()

A.mysql

B.derby

C.oracle

D.文本文件

11、HBase依赖()提供消息通信机制。

A.Zookeeper

B.Chubby

C.RPC

D.Socket

12、LSM含义是?()

A.日志结构合并树

B.二叉树

C.平衡二叉树

D.长平衡二叉树

13、HFile数据格式中的Data字段用于()。

A.存储实际的KeyValue数据

B.存储数据的起点

C.指定字段的长度

D.存储数据块的起点

14、下列不属于StreamGrouping方式的是()。

A.ShuffleGrouping

B.AllGrouping

C.FieldsGrouping

D.newGrouping

15、Storm会在集群内分配对应并行度个数的()来同时执行这一组件。

A.哈希值

B.Thrift

C.task线程

D.Worker进程

16、Storm可以用来实时处理新数据和()。

A.删除数据库

B.更新数据库

C.删除节点

D.更新表

17、MapReduce编程模型,键值对key,value的key必须实现哪个接口?()。

A.WritableComparable

B.Comparable

C.Writable

D.LongWritable

18、HBase数据库的BlockCache缓存的数据块中,哪一项不一定能提高效率()。

A.–ROOT-表

B..META.表

C.HFileindex

D.普通的数据块

19、HBase的Region组成中,必须要有以下哪一项( )。

A.StoreFile

B.MemStore

C.MetaStore

D.HFile

20、设计分布式数据仓库hive的数据表时,为取样更高效,一般可以对表中的连续字段进行什么操作()。

A.分桶

B.分区

C.索引

D.分表

二、填空题(20题,每题1分,共10分)

21、Spouts会从外部读取流数据并持续发出。

22、当Spout或者Bolt发送元组时,它会把元组发送到每个订阅了该的Bolt上进行处理。

23、Storm采用了来作为

文档评论(0)

180****1080 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档