- 1、本文档共179页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2024年数据价值挖掘技能竞赛考试题库大全-下(多选题汇
总)
多选题
1.与自然语言处理相关的工具包Jieba,、Gensim,、NLTK,、Scikit-Learn的区
别是()。
A、Jieba专注于中文分词操作
B、NLTK主要用于一般自然语言处理任务(标记化,POS标记,解析等)C、Gensim主要用于题和向量空间建模、文档集合相似性等
D、Scikit-learn为机器学习提供了一个大型库,其中包含了用于文本预处理的工具,例如词频-逆文档频率特征提取(TfidfVectorizer)等。
答案:ABCD
2.下面哪些函数中,是有效的类构造函数有()。A、def_Init_(self):
B、def_init_(self,var=0):C、def_init_):
D、ef_init_(self,a,b,c):答案:ABD
3.以下图像技术中属于图像处理技术的是()。
A、图像编码B、图像合成C、图像增强
D、图像分类答案:AC
4.可视化高维展示技术在展示数据之间的关系以及数据分析结果方面()。
A、能够直观反映成对数据之间的空间关系B、能够直观反映多维数据之间的空间关系C、能够静态演化事物的变化及变化的规律D、能够动态演化事物的变化及变化的规律答案:BD
5.Python函数包括下述哪些内容()。
A、函数名称
B、参数
C、执行语句D、返回值答案:ABCD
6.情感分析的应用场景有()。
A、数据挖掘B、信息检索C、文本分词D、市场营销答案:ABD
7.如果希望减少数据集中的特征数量,则可以采取的措施是()。A、使用正向选择法(ForwardSelection)
B、使用反向消除法(BackwardElimination)C、逐步选择消除法(Stepwise)
D、计算不同特征之间的相关系数,删去相关系数高的特征之一答案:ABCD
8.参数估计可以分为()。
A、点估计
B、一致估计C、区间估计D、无偏估计答案:AC
9.在正则化公式中,λ为正则化参数,关于λ的描述正确的是()。A、若正则化参数λ过大,可能会导致出现欠拟合现象
B、若λ的值太大,则梯度下降可能不收敛
C、取一个合理的λ值,可以更好地应用正则化
D、如果令λ的值很大的话,为了使CostFunction尽可能的小,所有θ的值(不
包括θ0)都会在一定程度上减小答案:ABCD
10.直方图修正法包括()。
A、直方图统计
B、直方图均衡
C、直方图过滤
D、直方图规定化
答案:BD
11.实时计算类应用主要通过()来实现。
A、流计算组件
B、内存计算组件C、MPP数据库
D、Hadoop的后台定时分析计算任务答案:AB
12.神经网络的拓扑结构可以分为()和随机型网络等。
A、前向型B、后向型C、反馈型
D、自组织竞争型答案:ACD
13.下面关于连续型随机变量以及连续型概率密度函数的说法,正确的是()。A、“一个客服一天可能接听到多少个电话”是一个连续型随机变量
B、正态分布是一种连续型随机变量的概率分布
C、可以使用概率密度函数来描述连续型随机变量的概率分布
D、连续型概率密度函数曲线下方的面积之和为1答案:BCD
14.ETL技术主要涉及()操作。
A、抽取B、转换
C、加载D、分析
答案:ABC
15.关于Python分隔代码块,描述错误的是()。
A、内嵌代码的每一行,都比外面的if语句的缩进更多B、代码以“begin”开头,“end”结尾
C、每行代码的缩进都一致
D、代码块被封装在花括号中答案:BCD
16.下面对范数规则化描述,正确的是()。A、L0是指向量中0的元素的个数
B、L1范数是指向量中各个元素绝对值之和C、L2范数向量元素绝对值的平方和再开平方
D、L0是指向量中非0的元素的个数答案:BCD
17.常用的代价函数有()。A、均方误差
B、均方根误差
C、平均绝对误差D、交叉熵
答案:ABCD
18.常见的图像降噪方式包括()。
A、中值滤波B、均值滤波
C、平均滤波
D、加权平均滤波答案:ABCD
19.以下选项中,属于MapReduce特征的有()。
A、以主从结构的形式运行B、容错机制的复杂性
C、任务备份机制的必要性
D、数据存储位置固定答案:ABC
20.以下关于L1和L2范数的描述,正确的是()。
A、L1范数为x向量各个元素绝对值之和。
B、L2范数为x向量各个元素平方和的1/2次方,L2范数又称Euclidean范数或Frobenius范数
C、L1范数可以使权值稀疏,方便特征提取
D
您可能关注的文档
- 河道修防工(高级)技能鉴定考试题库-下(多选、判断题汇总).docx
- 2024年社区护理服务(公共卫生学及护理学)专业技能知识试题库与答案.docx
- 2024年江西省“振兴杯”工具钳工竞赛考试题库(含答案).docx
- 2024年河北省网约配送员职业技能竞赛理论考试题库(含答案).docx
- 2024年“湖北工匠杯”技能大赛“信息网络布线”赛项备赛试题库(含答案).docx
- 2024年电力行业职业技能竞赛(焊工)理论试题库-下(多选、判断题汇总).docx
- 2024年吉林省预防接种技能竞赛理论考试题库(含答案).docx
- 钢厂脱硫操作工职业技能考试题库及答案.pdf
- 金属冶炼安全管理人员考试题库(通用版).pdf
- 炼钢炉前工职业技能鉴定考试题库与答案(完整版).pdf
文档评论(0)