- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库与数据挖掘试题
武汉大学计算机学院
2014级研究生“数据仓库和数据挖掘”课程期末考试试题
要求:所有的题目的解答均写在答题纸上,需写清楚题目的序号。每张答题纸都要写上姓名和学号。
一、单项选择题(每小题2分,共20分)
1. 下面列出的条目中,数据仓库的基本特征A.数据仓库是面向主题的B.数据仓库是面向事务的C.数据仓库的数据是相对稳定的D.数据仓库的数据是反映历史变化的2. 数据仓库是随着时间变化的下面的描述不正确的是A.数据仓库随时间的变化不断增加新的数据内容B.捕捉到的新数据会覆盖原来的快照C.数据仓库随事件变化不断删去旧的数据内容D.数据仓库中包含大量的综合数据这些综合数据会随着时间的变化不断地进行重新综合3. 以下关于数据仓库设计的说法中( )是错误的。A
A.数据仓库项目的需求很难把握,所以不可能从用户的需求出发来进行数据仓库的设计,只能从数据出发进行设计
B.在进行数据仓库主题数据模型设计时,应该按面向部门业务应用的方式来设计数据模型
C.在进行数据仓库主题数据模型设计时要强调数据的集成性
D.在进行数据仓库概念模型设计时,需要设计实体关系图,给出数据表的划分,并给出每个属性的定义域
4. 以下关于OLAP的描述中( )是错误的。A
A.一个多维数组可以表示为(维1,维2,…,维n)
B.维的一个取值称为该维的一个维成员
C.OLAP是联机分析处理
D.OLAP是数据仓库进行分析决策的基础
5. 多维数据模型中,下列( )模式不属于多维模式。D
?A.星型模式???? B.雪花模式???? C.星座模式???? D.网型模式
6. 通常频繁项集、频繁闭项集最大频繁项集之间的关系是A.频繁项集频繁闭项集最大频繁项集B.频繁项集最大频繁项集频繁闭项集C.最大频繁项集(频繁闭项集(频繁项集
D.频繁闭项集(频繁项集(最大频繁项集
7. 决策树中不包含结点A.根结点B.内部结点C.外部结点D.叶结点下面选项中t不是s的子序列的是A.s={2,4},{3,5,6},{8} t={2},{3,6},{8}
B.s={2,4},{3,5,6},{8} t={2},{8}
C.s={1,2},{3,4} t={1},{2}
D.s={2,4},{2,4} t={2},{4}
9. 前馈神经网络用于分类时,以下( )是不合理的迭代结束条件。D
A.前一周期所有的Δwij都很小,小于某个指定的阈值
B.前一周期未正确分类的样本百分比小于某个阈值
C.超过预先指定的周期数
D.学习率小于某个阈值
10. 以下叙述中,( )是错误的。D
A.逻辑回归用于分析二分类或有次序的依变量和自变量之间的关系
B.SVM是一种基于分类边界的方法
C.朴素贝叶斯算法和树增强朴素贝叶斯算法是按照描述属性是否独立来划分的
D.以上都不对
二、(20分)假设某大型人事部门已有一个人事管理系统,包含如下数据表:
职工(编号,姓名,出生日期,工作地点,月工资,备注)
现要设计一个人事数据仓库,用于分析各地区(华北、华中、华东、…)、各年龄层次(老、中、青)的工资水平(高、中、低)等。
回答以下问题:
(1)根据你的思考设计该数据仓库的模式图,包含每个维表和事实表的结构。(10分)
(2)指出你设计的数据仓库属于哪种模式。(5分)
(3)由[出生日期,工作地点,月工资]的基本方体开始,求华东地区的青年职工中高收入的人数,应当执行哪些OLAP操作?(5分)
三、(20分)有一个如表1所示的事务数据库,设最小支持度为40%,最小置信度为80%。
表1 一个事务数据库
TID(编号) Itemset(项集) 1 1,3,4 2 2,3,4,5 3 1,3,5,7 4 2,5 5 1,2,4,6,7 6 2,4,6 回答以下问题:
(1)采用Apriori算法求出所有的频繁集。要求给出求解过程。(15分)
(2)求出所有与元规则“item1∧item2→item3”相匹配的强关联规则。(5分)
四、(15分)对于如表2所示的决策表(U,C∪D),C={a,b,c,d},D={e},回答以下问题:
(1)求U/C和U/D。(5分)
(2)求POSC(D),该决策表是否为一致(或协调)决策表? (5分)
(3)采用分辨矩阵求其所有条件属性约简和核。(5分)
表2 一个决策表
U a b c d e 1 1 0 2 1 1 2 1 0 2 0 1 3 1 2 0 0 2 4 1 2 2 1 0 5 2 1 0 0 2 6 2 1 1 0 2 7 2 1 2 1 1 五、(25分)回答以下关于聚类的问题:
(1)k-中心点算法和k-均值算法相比有什么优点?(5分)
(2)BIRCH算法是什么类型的聚类算法?通常采用簇的聚类特征为CF=(N,LS,SS),
您可能关注的文档
- 政治学原理教学大纲.doc
- 政治学概论名词解释汇总.doc
- 政治学基础名词解释汇总.doc
- 政治期中复习.doc
- 政治学博士必读书目.doc
- 政治生活9.doc
- 政治生活主观题.doc
- 政治经济学(社).doc
- 政治经济学原理考试重点.doc
- 政治经济学知识点(详细版).doc
- 2022-2023学年福建省莆田二十五中八年级(下)期末数学试卷(含解析).pdf
- 2019年苏教版下册二年级语文补充习题答案 (I) .pdf
- 2022年上海市黄浦区第十中学中考三模物理试题(含答案解析) .pdf
- 2020年广西南宁三中初中部大学区中考数学三模试卷(附答案详解) .pdf
- 2019版必修中外历史纲要上册第25课人民解放战争导学案(无答案.pdf
- 2021年(初级)银行从业资格模拟试题6篇 .pdf
- 2022初级银行从业资格之初级银行业法律法规与综合能力高分题库附精品.pdf
- 2022年威海职业学院单招语文模拟试题(附答案解析) .pdf
- 2021年湘教版九年级化学(上册)月考月考试卷(附答案) .pdf
- 2022-2023学年广西南宁二中学数学八年级第一学期期末学业质量监测模拟试 .pdf
最近下载
- 五四制初中一年级中华优秀传统文化教学设计.pptx VIP
- 《微生物与健康》课件科学六年级上册.pptx
- 七年级上册生物学《生物体的结构层次》单元作业设计.docx
- 电子信息工程职业规划 (第二版).pptx VIP
- 党的二十届三中全会精神测试题300道(单选、多选、判断、填空).docx VIP
- 部编教材年级识字课教学.ppt VIP
- 贵州省贵阳市2024-2025学年高一上学期10月联合考试(一) 数学 PDF版含解析.pdf
- 基于Android的个人生活行为记录及习惯养成平台的设计与实现-毕业设计.doc
- 中国传媒大学-节目主持艺术基础(第二版)-课件.pptx
- 纤维增强复合材料在建筑工程结构加固中的应用(经济论文资料).doc
文档评论(1)