- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中北大学数据挖掘
上传作者:瑞睿锐
第一章 绪论
一.判断题(共10题,83.0分)
下面各项是否是数据挖掘任务?
1根据性别划分公司的顾客?????
我的答案:×?得分:?8.3分正确答案:× 答案解析: 这属于简单的数据库查询
2根据可盈利性划分公司的顾客
我的答案:×?得分:?8.3分正确答案:× 答案解析: 这是简单的会计计算
3计算公司的总销售额
我的答案:×?得分:?8.3分正确答案:× 答案解析: 这是简单的会计计算
4按学生的标识号对学生数据库进行排序
我的答案:×?得分:?8.3分正确答案:× 答案解析: 这是简单的数据库查询
5 预测掷骰子的结果
我的答案:×?得分:?8.3分正确答案:× 答案解析: 由于每一面都是同等概率,属于概率计算;如果概率是不同等,根据历史数据预测结果则更类似于数据挖掘任务
6 使用历史记录预测某公司未来的股价价格
我的答案:√?得分:?8.3分正确答案:√ 答案解析: 需要建立模型来预测股票价格,属于数据挖掘领域中的预测模型,可以使用回归来建模,或使用时间序列分析
7 监测病人心率的异常变化
我的答案:√?得分:?8.3分正确答案:√ 答案解析: 需要建立正常心率行为模型,并预警非正常心率行为。这属于数据挖掘领域的异常检测。若有正常和非正常心率行为样本,则可看作一个分类问题
8 监视地震活动的地震波
我的答案:√?得分:?8.3分正确答案:√ 答案解析: 需要建立与地震活动相关的不同波形的模型,并预警波形活动。这属于数据挖掘领域的分类问题
9 提取声波的频率
我的答案:×?得分:?8.3分正确答案:× 答案解析: 属于信号处理问题
10 为用户提供电影推荐
我的答案:√?得分:?8.3分正确答案:√ 答案解析: 典型推荐问题
二.简答题(共2题,17.0分)
1 举例说明数据挖掘、数据分析、机器学习、人工智能的概念以及区别。
正确答案:
数据挖掘是:从海量的业务数据中识别出巨量数据中有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。数据挖掘受到很多学科领域的影响,其中数据库、机器学习、统计学无疑影响最大。简言之,对数据挖掘而言,数据库提供数据管理技术,机器学习和统计学提供数据分析技术。
数据分析,是指使用适当的统计分析方法(如聚类分析、相关性分析等)对收集来的大量数据进行分析,从中提取有用信息和形成结论,并加以详细研究和概括总结的过程。
机器学习:利用经验(以数据的形式存在)来改善计算机系统自身的性能,是人工智能的核心研究领域之一,也是计算机科学的子领域,同时也是人工智能的一个分支和实现方式。同时给出了形式化的描述:对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么就称这个计算机程序在从经验E学习。
人工智能:是使计算机模拟或实现人类的学习行为,以获取新的知识和技能,使之不断改善自身的性能。
区别:我们可以把数据挖掘理解为一种类型的工作,或工作中的某种成分,机器学习是帮助完成这个工作的方法,所以说机器学习和数据库是数据挖掘的两大支撑技术。统计学、数据库和人工智能共同构造了数据挖掘技术的三大支柱,许多成熟的统计方法构成了数据挖掘的核心内容。数据分析是把数据变成信息的工具,数据挖掘是把信息变成认知的工具,如果我们想要从数据中提取一定的规律(即认知)往往需要数据分析和数据挖掘结合使用。从数据分析的角度来看,绝大多数数据挖掘技术都来自机器学习领域,但机器学习研究往往并不把海量数据作为处理对象,因此,数据挖掘要对算法进行改造,使得算法性能和空间占用达到实用的地步。同时,数据挖掘还有自身独特的内容,即关联分析。
我的答案:
概念
数据挖掘:一般是指从大量的数据中通过算法有哪些信誉好的足球投注网站隐藏于其中信息的过程。
数据分析:是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程;
机器学习:通过计算机实现并采用特定算法学习和识别被测对象的隐含规律和联系,并做出智能决策;
人工智能:是使计算机模拟或实现人类的学习行为,以获取新的知识或技能,使之不断改善自身的性能;
二、区别
1、数据挖掘通常与计算机科学有关,更多针对内部企业行业小众化的数据挖掘,数据挖掘主要发现的是问题和诊断;
2、数据分析就是进行做出针对性的分析和诊断;
3、机器学习强调学习(任务?训练过程?模型表现P),而不是计算机程序;
4、人工智能包括了数据挖掘和机器学习,人工智能是目的、结果。机器学习是方法、工具; 批语 回答正确
2 当前主流的数据挖掘工具有哪些?下载其中一个工具,尝试简单操作。
正确答案: 1、 Weka WEKA作为一个公开
文档评论(0)