大数据架构、高性能、数据治理题目.pdf

大数据架构、高性能、数据治理题目.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

大数据架构、高性能、数据治理题目--第1页

a.大数据的高级处理技术(占比5%)

单选题目:

1.以下__不属于大数据的关键技术

A.数据技术

B.大数据安全技术和大数据质量技术

C.虚拟化技术和云计算平台技术

D.海量数据的存储技术

答案:C

2.Spark比Hadoop的MR计算高效,主要原因不包含下面__

A.Spark支持DAG

B.Spark中间数据不存储磁盘,进行缓存处理。

C.Spark采用MPP架构,并发处理

D.高度抽象API

答案:C

3.下面对流式计算理解错误的是___

A.流式计算满足高效实时的场景

B.实时计算是更快的批量计算,更快的交付数据

C.流式计算需要先提交流式计算作业、等待数据流触发操作

D.流式计算连续计算,计算完数据丢弃

答案B

4.BloomFilter(BF)是一种空间效率很高的随机数据结构,下面描述错误的是

__

A.它是一个判断元素是否存在集合的概率算法

B.判断如果不在集合肯定不在,如果在集合有一定的概率判错

C.它支持从集合中删除一个元素

D.Hash函数的选择会影响到算法的效果

答案:C

多选题目

5.问:大数据引擎的性能优化手段,包含下面____

A:计算引擎的任务调度时,尽量本地化计算,减少数据网络输出。

B:数据以流的方式在不同stage传输,减少物化到磁盘。

C:采取数据列式存储,包括轻量级压缩数据、延迟解压、向量化引擎技术。

D:MPP架构采取细粒度容错,解决落后节点影响整个查询性能。

大数据架构、高性能、数据治理题目--第1页

大数据架构、高性能、数据治理题目--第2页

答案:ABC

b.大数据架构设计方法论概述(占比3%)

单选题:

6.分布式系统的ID生成系统,不包含的是__

A.生成的ID必须考虑主机的差异性

B.ID必须全局唯一性,不会出现重复

C.ID是没有规律的,处于信息安全考虑

D.高QPS,性能强劲,低延迟交付

答案A

7.CAP理论理解错误的是___

A.CAP的背景是同一份数据多个副本场景

B.大数据场景下对A/P要求较高,对C反而要求较低

C.AP既适用于NoSQL数据库,也适用于关系型数据库

D.关系型数据库是为了保证P、A而牺牲C

答案:D

多选题:

8.用户行为数据处理的注意点有___

A.埋点数据一定要符合业务数据信息流才能保证数据处理的完整性

和确保数据的可用性

B.行为数据要与其他数据源做一致性关联,确保数据的一致性和关

联性

C.行为数据的元数据尽可能从源头字段化保存到数据文件中

D.埋点数据可以是可视化埋点和非可视化埋点

答案:ABCD

c.大数据之常见场景下的架构设计(占比5%)

单选题:

9.RBAC权限模型的架构描述错误的是___

A.用于将需要做权限验证的定义为角色

文档评论(0)

131****2708 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档