数据工程师培训题库.docx

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
星环信息科技(上海)有限公司 星环信息科技(上海)有限公司 TDH 数据平台认证工程师试题 姓名: 分数: 【说明】 客观题 30 题,每题 2 分,总计 60 分 主观题 4 题,每题 10 分,总计 40 分 满分 100 分。 【不定项选择题(每题 2 分共 60 分)】 A .Data NodeB .Journal Node C . ZKFCD . Zookeeper1、在 HDFS 服务中,为了保证 A .Data Node B .Journal Node C . ZKFC D . Zookeeper 2、Namenode 在启动时自动进入安全模式,在安全模式阶段,说法错误的是() 安全模式目的是在系统启动时对数据有效性进行检查 根据策略对数据块进行必要的复制或删除 当数据块的上报数达到阈值时,会自动退出安全模式 允许用户对文件系统进行读写操作 3、在集群中配置 HDFS 的副本数为 3,设置数据块大小为 128M,此时我们上传一份 64M 的数据文件,该数据文件占用 HDFS 空间大小为() A . 64M B . 128M C . 384M D . 192M 4、下列对 YARN 角色在集群中的作用描述正确的是() A .集群资源管理 B .集群任务调度与管理 C .存储部分 HDFS 上的数据块D .以上都正确 5、在 Yarn 服务中,不包含以下哪种角色() A .ResourceManager B .NodeManager C .ApplicationMaster D .Contianer 6、下列计算框架中不属于分布式计算框架的是() A .MapReduce B . MATLAB C . SPARK D .Tez 7、以下关于外表和托管表描述正确的是() A、外表的数据存储在本地,托管表的数据存储在hdfs 上 B、删除托管表只会删除 Inceptor 上的元数据不会删除数据文件,删除外表两者都会被删除 C、删除外表只会删除 Inceptor 上的元数据不会删除数据文件,删除托管表两者都会被删除 D、删除托管表或外表,incepotr 上的元数据和数据文件都会被删除 8、以下对分桶表的描述正确的是() A、分桶表通过改变数据的存储分布,对查询起到一定的优化作用 B、分桶键不能是表中的列 C、分桶数应为素数 D、事物表必须制定分桶,分桶字段可以被更新 9、以下关于 inceptor excutor 资源配置的说法正确的有() A、Excutor 资源配置 fixed 和 ratio 两种模式 B、Excutor 内核数配置的是每个 excutor 所使用的逻辑 core 数量C、Excutor 内核数和内存配置比例一般为 1 core:2G memory D、 Excutor 分布可以指定每个节点运行的 excutor 数量或 executor 在集群上运行的总数量,但是不能指定运行的节点 10、假设使用场景中有如下查询语句SELECT Sex, Region, COUNT(ID), AVG (Salary) FROM Employee WHERE Department = IT GROUP BY Sex, Region ORDER BY Sex, Region; 通过 holodesk 的 cube 和 index 手段对这种过滤率和聚合率高的业务进行优化,以下建表正确的是() CREATE TABLE Employee TBLPROPERTIES ( cache = RAM, holodesk.index = Department, holodesk.dimension = Sex, Region ) CREATE TABLE Employee TBLPROPERTIES ( cache = RAM, holodesk.index = Sex, Region holodesk.dimension = Department ) CREATE TABLE Employee TBLPROPERTIES ( cache = Department, holodesk.index = Department, holodesk.dimension = Sex, Region ) CREATE TABLE Employee TBLPROPERTIES ( cache = RAM, holodesk.index = Department, holodesk.dimension = Sex ) 11、关于 Hyperbase 全局索引的描述,哪些是正确的?() A.核心是倒排表 B.全局索引概念是对应 Rowkey 这个“一级”索引C.全局索引使用平衡二叉树 D.全局索引使用 B+树检索数据 12、以下为 Hyp

文档评论(0)

hao187 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体武汉豪锦宏商务信息咨询服务有限公司
IP属地上海
统一社会信用代码/组织机构代码
91420100MA4F3KHG8Q

1亿VIP精品文档

相关文档