- 1、本文档共211页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数挖试卷整合.doc
浙江财经大学2014~适用专业、班级:13 经济统计
题 号 一 二 三 四 五 六 七 八 九 十 总分 得 分 评卷人 (共五大题)
一、判断题(下列各题正确的打√;错误的打×。每小题2分,共20分)
1. DBSCAN是相对抗噪声的,并且能够处理任意形状和大小的簇。(对). 聚类分析可以看作是一种非监督的分类。(对).分类模型的误差大致分为两种:训练误差(training error)和泛化误差(generalization error). (对). 具有较高的支持度的项集具有较高的置信度。(错). 利用先验原理可以帮助减少频繁项集产生时需要探查的候选项个数(对)。. 商业智能系统与一般交易系统之间在系统设计上的主要区别在于:后者把结构强加于商务之上,一旦系统设计完毕,其程序和规则不会轻易改变;而前者则是一个学习型系统,能自动适应商务不断变化的要求。 (对). 离群点可以是合法的数据对象或者值。 (对). 可视化技术对于分析的数据类型通常不是专用性的。 (错). 数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。 (对). 从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。(错)
A 性别=“男”= 职业=“司机”,是布尔型关联规则
B 性别=“女”= avg(收入)=2300,是一个数值型关联规则
C 肝炎= ALT(丙氨酸转氨酶
D 性别=“女”= 职业=“秘书”,是多维关联规则。
2.在有指导的数据挖掘中,有关测试集的说法错误的是(A)
A. 测试集和训练集是相互联系的
B. 测试集是用以测试模型的数据集
C. 通常测试集大约占总样本的三分之一
D. K-次交叉验证中,测试集只有 1 个,训练集有K-1个。
3. 一个对象的离群点得分是该对象周围密度的逆。这是基于( C )的离群点定义。 A.概率 B、邻近度 C、密度 D、聚类. 考虑这么一种情况:一个对象碰巧与另一个对象相对接近,但属于不同的类,因为这两个对象一般不会共享许多近邻,所以应该选择( D )的相似度计算方法。 A、平方欧几里德距离 B、余弦距离 C、直接相似度 D、共享最近邻.( D )将两个簇的邻近度定义为两个簇合并时导致的平方误差的增量,它是一种凝聚层次聚类技术。 A、MIN(单链) B、MAX(全链) C、组平均 D、Ward方法.( C )是一个观测值,它与其他观测值的差别如此之大,以至于怀疑它是由不同的机制产生的。 A、边界点 B、质心 C、离群点 D、核心点. 考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出,剩余的比赛队1获胜。队0获胜的比赛中只有30%是在队1的主场,而队1取胜的比赛中75%是主场获胜。如果下一场比赛在队1的主场进行队1获胜的概率为 (C)A,0.75 B,0.35 C,0.4678 D, 0.5738. 在基于规则分类器的中,依据规则质量的某种度量对规则排序,保证每一个测试记录都是由覆盖它的“最好的”规格来分类,这种方案称为 (B)A. 基于类的排序方案 B. 基于规则的排序方案 C. 基于度量的排序方案 D. 基于规格的排序方案。. 下列__(A)__不是将主观信息加入到模式发现任务中的方法。A、与同一时期其他数据对比B、可视化C、基于模板的方法D、主观兴趣度量. 关于OLAP和OLTP的区别描述,不正确的是: (C)A. OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同.B. 与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务.C. OLAP的特点在于事务量大,但事务内容比较简单且重复率高.D. OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的.. 在有关数据仓库测试,下列说法不正确的是: (D)A. 在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试.B. 当数据仓库的每个单独组件完成后,就需要对他们进行单元测试.C. 系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试.D. 在测试之前没必要制定详细的测试计划.. 关于基本数据的元数据是指: (D)A. 基本元数据与数据源,数据仓库,数据集市和应用程序等结构相关的信息;B. 基本元数据包括与企业相关的管理方面的数据和信息;C. 基本元数据包括日志文件和简历执行处理的时序调
您可能关注的文档
- 应急和日常安全知识题库.doc.doc
- 应急操作卡(改).doc.doc
- 广谱抗菌药物防治造血干细胞移植后的早期感染.doc.doc
- 应急处置卡编制模板.doc.doc
- 应急救援安全知识.doc.doc
- 应用乳腺触诊成像检查的临床意义.doc.doc
- 应用3D打印技术制作组织工程支架:修复骨缺损的研究回顾.doc.doc
- 应知应会泌尿外科.doc.doc
- 应知应会心胸外科.doc.doc
- 应用弯角椎体成形装置修复胸腰段骨质疏松性椎体压缩骨折.doc.doc
- 2024年-人教版PEP小学英语四年级下册春季学期期考.docx
- 2024年-人教版小学数学期中质量检测卷(附答案)[1].doc
- 2024年-人教版PEP英语五年级上册Unit 2 单元教案 1.doc
- 2024年-部编版三年级语文期末专项卷 字词.doc
- 创意油画棒--可爱的小刺猬—美术课件.ppt
- 二年级《认识万以内的数》奥数课件.ppt
- 2024年-新苏教版数学六年级上册4 分数连除、乘除混合运算 教案.docx
- 2024年-人教版语文八年级上册19 蝉 主课件配套教案.doc
- 2024年-部编版四年级语文第七单元知识小结.docx
- 2024年-人教版小学数学第五单元平行四边形和梯形教学设计及教学反思作业题及答案[1].doc
文档评论(0)