- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
大数据架构、高性能、数据治理题目--第1页
a.大数据的高级处理技术(占比5%)
单选题目:
1.以下__不属于大数据的关键技术
A.数据技术
B.大数据安全技术和大数据质量技术
C.虚拟化技术和云计算平台技术
D.海量数据的存储技术
答案:C
2.Spark比Hadoop的MR计算高效,主要原因不包含下面__
A.Spark支持DAG
B.Spark中间数据不存储磁盘,进行缓存处理。
C.Spark采用MPP架构,并发处理
D.高度抽象API
答案:C
3.下面对流式计算理解错误的是___
A.流式计算满足高效实时的场景
B.实时计算是更快的批量计算,更快的交付数据
C.流式计算需要先提交流式计算作业、等待数据流触发操作
D.流式计算连续计算,计算完数据丢弃
答案B
4.BloomFilter(BF)是一种空间效率很高的随机数据结构,下面描述错误的是
__
A.它是一个判断元素是否存在集合的概率算法
B.判断如果不在集合肯定不在,如果在集合有一定的概率判错
C.它支持从集合中删除一个元素
D.Hash函数的选择会影响到算法的效果
答案:C
多选题目
5.问:大数据引擎的性能优化手段,包含下面____
A:计算引擎的任务调度时,尽量本地化计算,减少数据网络输出。
B:数据以流的方式在不同stage传输,减少物化到磁盘。
C:采取数据列式存储,包括轻量级压缩数据、延迟解压、向量化引擎技术。
D:MPP架构采取细粒度容错,解决落后节点影响整个查询性能。
大数据架构、高性能、数据治理题目--第1页
大数据架构、高性能、数据治理题目--第2页
答案:ABC
b.大数据架构设计方法论概述(占比3%)
单选题:
6.分布式系统的ID生成系统,不包含的是__
A.生成的ID必须考虑主机的差异性
B.ID必须全局唯一性,不会出现重复
C.ID是没有规律的,处于信息安全考虑
D.高QPS,性能强劲,低延迟交付
答案A
7.CAP理论理解错误的是___
A.CAP的背景是同一份数据多个副本场景
B.大数据场景下对A/P要求较高,对C反而要求较低
C.AP既适用于NoSQL数据库,也适用于关系型数据库
D.关系型数据库是为了保证P、A而牺牲C
答案:D
多选题:
8.用户行为数据处理的注意点有___
A.埋点数据一定要符合业务数据信息流才能保证数据处理的完整性
和确保数据的可用性
B.行为数据要与其他数据源做一致性关联,确保数据的一致性和关
联性
C.行为数据的元数据尽可能从源头字段化保存到数据文件中
D.埋点数据可以是可视化埋点和非可视化埋点
答案:ABCD
c.大数据之常见场景下的架构设计(占比5%)
单选题:
9.RBAC权限模型的架构描述错误的是___
A.用于将需要做权限验证的定义为角色
文档评论(0)