网站大量收购闲置独家精品文档,联系QQ:2885784924

《大学计算机基础》课件_第7章.pptx

  1. 1、本文档共54页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

项目7计算机前沿技术;

1.了解大数据、数据挖掘、云计算、人工智能、区块链技术的发展概况;

2.了解前沿技术目前在各应用领域如何落地;

3.了解大数据技术对人类生活的影响。;

7.1计算机时代的生活;

7.2大数据与数据挖掘;

7.2.2数据挖掘及其与大数据的关系

数据挖掘是指通过大量数据集进行分类的自动化过程,以通过数据分析来识别趋势和模式,建立关系来解决业务问题。换句话说,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。;

数据挖掘分为有指导的数据挖掘和无指导的数据挖掘。有指导的数据挖掘是利用可用的数据建立一个模型,这个模型是对一个特定属性的描述。无指导的数据挖掘是在所有的属性中寻找某种关系。具体而言,分类、估值和预测属于有指导的数据挖掘;关联规则和聚类属于无指导的数据挖掘。

大数据是一个领域,是专门应对大量数据的领域。;

7.2.3数据挖掘算法

1)神经网络法

神经网络法是模拟生物神经系统的结构和功能,是一种通过训练来学习的非线性预测模型,它将每一个连接看作一个处理单元,试图模拟人脑神经元的功能,可完成分类、聚类、特征挖掘等多种数据挖掘任务。;

神经网络的学习方法主要表现在权值的修改上,其优点是具有抗干扰,非线性学习,联想记忆功能,对复杂情况能得到精确的预测结果;缺点是不适合处理高维变量,不能观察中间的学习过程,具有“黑箱”性,输出结果也难以解释,需要较长的学习时间。神经网络法主要应用于数据挖掘的聚类技术中。;

2)决策树法

决策树法是根据对目标变量产生效用的不同而建构分类的规则,通过一系列的规则对数据进行分类的过程,其表现形式是类似于树形结构的流程图。最典型的算法是罗斯·昆兰(RossQuinlan)于1986年提出的ID3算法,之后在ID3算法的基础上又提出了极其流行的C4.5算法。

采用决策树法的优点是决策制定的过程是可见的,不需要长时间构造过程,描述简单,易于理解,分类速度快;缺点是很难基于多个变量组合发现规则。;

3)遗传算法

遗传算法模拟了自然选择和遗传中发生的繁殖、交配和基因突变现象,是一种采用遗传结合、遗传交叉变异及自然选择等操作来生成实现规则的、基于进化理论的机器学习方法。它的基本观点是“适者生存”原理,具有隐含并行性,易于和其他模型结合等性质。

遗传算法主要的优点是可以处理许多数据类型,同时可以并行处理各种数据;缺点是需要的参数太多,编码困难,一般计算量比较大。遗传算法常用于优化神经元网络。;

4)粗糙集法

粗糙集法也称粗糙集理论,是由波兰数学家波拉克(Pawlak)在20世纪80年代初提出的,是一种新的处理含糊、不精确、不完备问题的数学工具,可以处理数据约简、数据相关性发现、数据意义的评估等问题。

粗糙集法的优点是算法简单,在其处理过程中可以不需要关于数据的先验知识,可以自动找出问题的内在规律;缺点是难以直接处理连续的属性,需要先进行属性的离散化。;

5)模糊集法

模糊集法是利用模糊集合理论对问题进行模糊评判、模糊决策、模糊模式识别和模糊聚类分析。模糊集合理论是用隶属度来描述模糊事物的属性,系统的复杂性越高,模糊性就越强。

;

6)关联规则法

关联规则法反映了事物之间的相互依赖性或关联性,最著名的算法是由阿格拉瓦尔(Agrawal)等人提出的Apriori算法。

关联规则法的算法思想是:首先找出频繁性至少和预定意义的最小支持度一样的所有频集。然后由频集产生强关联规则这样规则必须满足最小支持度和最小可信度。在这个意义上,数据挖掘的目的就是从源数据库中挖掘出满足最小支持度和最小可信度的关联规则。;

7.3大数据的应用;

;

(2)风险管控:依据客户消费和现金流提供信用评级或融资支持,利用客户社交行为记录实施信用卡反欺诈。

(3)决策支持:利用决策树技术进抵押贷款管理,利用数据分析报告实施产业信贷风险控制。;

7.3.2大数据在医疗行业的应用

我们借助于大数据平台可以收集不同病例和治疗方案,以及病人的基本特征,可以建立针对疾病特点的数据库,如图7-2所示。;

;

7.3.3大数据在环保行业的应用

生态监测网实时数据也给数据平台带来性能挑战。而非结构化数据、时间序列数据、关系型数据等多类型数据,也增加了数据处理及分析的复杂性。因此大数据在环保行业有着不可或缺的作用,如图7-3所示。;

;

大数据正逐步转变人们的态度与

文档评论(0)

酱酱 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档