2024年数据价值挖掘技能竞赛考试题库大全-下(多选题汇总).docxVIP

2024年数据价值挖掘技能竞赛考试题库大全-下(多选题汇总).docx

  1. 1、本文档共179页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2024年数据价值挖掘技能竞赛考试题库大全-下(多选题汇

总)

多选题

1.与自然语言处理相关的工具包Jieba,、Gensim,、NLTK,、Scikit-Learn的区

别是()。

A、Jieba专注于中文分词操作

B、NLTK主要用于一般自然语言处理任务(标记化,POS标记,解析等)C、Gensim主要用于题和向量空间建模、文档集合相似性等

D、Scikit-learn为机器学习提供了一个大型库,其中包含了用于文本预处理的工具,例如词频-逆文档频率特征提取(TfidfVectorizer)等。

答案:ABCD

2.下面哪些函数中,是有效的类构造函数有()。A、def_Init_(self):

B、def_init_(self,var=0):C、def_init_):

D、ef_init_(self,a,b,c):答案:ABD

3.以下图像技术中属于图像处理技术的是()。

A、图像编码B、图像合成C、图像增强

D、图像分类答案:AC

4.可视化高维展示技术在展示数据之间的关系以及数据分析结果方面()。

A、能够直观反映成对数据之间的空间关系B、能够直观反映多维数据之间的空间关系C、能够静态演化事物的变化及变化的规律D、能够动态演化事物的变化及变化的规律答案:BD

5.Python函数包括下述哪些内容()。

A、函数名称

B、参数

C、执行语句D、返回值答案:ABCD

6.情感分析的应用场景有()。

A、数据挖掘B、信息检索C、文本分词D、市场营销答案:ABD

7.如果希望减少数据集中的特征数量,则可以采取的措施是()。A、使用正向选择法(ForwardSelection)

B、使用反向消除法(BackwardElimination)C、逐步选择消除法(Stepwise)

D、计算不同特征之间的相关系数,删去相关系数高的特征之一答案:ABCD

8.参数估计可以分为()。

A、点估计

B、一致估计C、区间估计D、无偏估计答案:AC

9.在正则化公式中,λ为正则化参数,关于λ的描述正确的是()。A、若正则化参数λ过大,可能会导致出现欠拟合现象

B、若λ的值太大,则梯度下降可能不收敛

C、取一个合理的λ值,可以更好地应用正则化

D、如果令λ的值很大的话,为了使CostFunction尽可能的小,所有θ的值(不

包括θ0)都会在一定程度上减小答案:ABCD

10.直方图修正法包括()。

A、直方图统计

B、直方图均衡

C、直方图过滤

D、直方图规定化

答案:BD

11.实时计算类应用主要通过()来实现。

A、流计算组件

B、内存计算组件C、MPP数据库

D、Hadoop的后台定时分析计算任务答案:AB

12.神经网络的拓扑结构可以分为()和随机型网络等。

A、前向型B、后向型C、反馈型

D、自组织竞争型答案:ACD

13.下面关于连续型随机变量以及连续型概率密度函数的说法,正确的是()。A、“一个客服一天可能接听到多少个电话”是一个连续型随机变量

B、正态分布是一种连续型随机变量的概率分布

C、可以使用概率密度函数来描述连续型随机变量的概率分布

D、连续型概率密度函数曲线下方的面积之和为1答案:BCD

14.ETL技术主要涉及()操作。

A、抽取B、转换

C、加载D、分析

答案:ABC

15.关于Python分隔代码块,描述错误的是()。

A、内嵌代码的每一行,都比外面的if语句的缩进更多B、代码以“begin”开头,“end”结尾

C、每行代码的缩进都一致

D、代码块被封装在花括号中答案:BCD

16.下面对范数规则化描述,正确的是()。A、L0是指向量中0的元素的个数

B、L1范数是指向量中各个元素绝对值之和C、L2范数向量元素绝对值的平方和再开平方

D、L0是指向量中非0的元素的个数答案:BCD

17.常用的代价函数有()。A、均方误差

B、均方根误差

C、平均绝对误差D、交叉熵

答案:ABCD

18.常见的图像降噪方式包括()。

A、中值滤波B、均值滤波

C、平均滤波

D、加权平均滤波答案:ABCD

19.以下选项中,属于MapReduce特征的有()。

A、以主从结构的形式运行B、容错机制的复杂性

C、任务备份机制的必要性

D、数据存储位置固定答案:ABC

20.以下关于L1和L2范数的描述,正确的是()。

A、L1范数为x向量各个元素绝对值之和。

B、L2范数为x向量各个元素平方和的1/2次方,L2范数又称Euclidean范数或Frobenius范数

C、L1范数可以使权值稀疏,方便特征提取

D

文档评论(0)

大友资料 + 关注
实名认证
文档贡献者

大友资料,资料朋友

版权声明书
用户编号:6120020140000005

1亿VIP精品文档

相关文档