- 1、本文档共36页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
项目9信息技术前沿;任务9.1大数据
任务9.2云计算
任务9.3人工智能
任务9.4区块链;【项目目标】
·了解信息技术前沿。
·掌握信息相关前沿的相关概念。;任务9.1大数据;9.1.1数据挖掘及其与大数据的关系
数据挖掘是通过大量数据集进行分类的自动化过程,它通过数据分析来识别趋势和模式,通过建立关系来解决业务问题。换句话说,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。
数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等方法来实现上述目标。
数据挖掘分为有指导的数据挖掘和无指导的数据挖掘。有指导的数据挖掘是利用可用的数据建立一个模型,这个模型是对一个特定属性的描述。无指导的数据挖掘是在所有的属性中寻找某种关系。具体而言,分类、估值和预测属于有指导的数据挖掘;关联规则和聚类属于无指导的数据挖掘。
大数据是一个领域,是专门应对大量数据的领域。数据挖掘属于数据分析的一部分,是对于大量数据中包含的信息的探索和分析,目的是提取数据中的价值。数据挖掘的前提是要有数据,这会涉及大数据集成。大数据集成也是大数据领域的一部分。;9.1.2数据挖掘算法
目前,数据挖掘的算法主要包括神经网络法、决策树法、遗传算法、粗糙集法、模糊集法、关联规则法等。
神经网络法是模拟生物神经系统的结构和功能,是一种通过训练来学习的非线性预测模型,它将每一个连接看作一个处理单元,试图模拟人脑神经元的功能,可完成分类、聚类、特征挖掘等多种数据挖掘任务。神经网络的学习方法主要表现在权值的修改上。其优点是具有抗干扰、非线性学习、联想记忆等功能,对复杂情况能得到精确的预测结果;缺点是不适合处理高维变量,不能观察中间的学习过程,具有“黑箱”性,输出结果也难以解释,且需较长的学习时间。神经网络法主要应用于数据挖掘的聚类技术中。
决策树根据对目标变量产生的效用不同而构建分类规则,通过一系列规则对数据进行分类,其表现形式类似于树形结构的流程图。采用决策树法的优点是制订决策的过程是可见的,不需要长时间构造过程,描述简单,易于理解,分类速度快;缺点是很难基于多个变量组合发现规则。决策树法擅长处理非数值型数据,特别适合大规模的数据处理。决策树法是一种展示在什么条件下会得到什么值这类规则的方法。;遗传算法模拟了自然选择和遗传中发生的繁殖、交配和基因突变现象,是一种采用遗传结合、遗传交叉变异及自然选择等操作来生成实现规则的、基于进化理论的机器学习方法。它的基本观点是适者生存原理,具有隐含并行性、易于和其他模型结合等性质。遗传算法的主要优点是可以处理许多数据类型,同时可以并行处理各种数据;缺点是需要的参数太多,编码困难,一般计算量比较大。遗传算法常用于优化神经元网络,能够解决其他技术难以解决的问题。
粗糙集法也称粗糙集理论,是由波兰数学家波拉克(Pawlak)在20世纪80年代初提出的,是一种新的处理含糊、不精确、不完备问题的数学工具,可以处理数据约简、数据相关性发现、数据意义评估等问题。其优点是算法简单,在其处理过程中不需要关于数据的先验知识,可以自动找出问题的内在规律;缺点是难以直接处理连续的属性,必须先进行属性的离散化。因此,连续属性的离散化问题是制约粗糙集理论实用化的难点。粗糙集理论主要应用于近似推理、数字逻辑分析和化简、预测模型建立等问题。;模糊集法是利用模糊集合理论对问题进行模糊评判、模糊决策、模糊模式识别和模糊聚类分析。模糊集合理论是用隶属度来描述模糊事物的属性。系统的复杂性越高,模糊性就越强。
关联规则反映了事物之间的相互依赖性或关联性,最著名的算法是阿格拉瓦尔(Agrawal)等人提出的Apriori算法。其算法的思想是:首先找出频繁性至少和预定意义的最小支持度一样的所有频集,然后由频集产生强关联规则。最小支持度和最小可信度是为了发现有意义的关联规则而给定的2个阈值。在这个意义上,数据挖掘的目的就是从源数据库中挖掘出满足最小支持度和最小可信度的关联规则。;2.1.1操作系统的功能
操作系统(OperatingSystem,OS)是管理和控制计算机硬件与软件资源的计算机程序,是直接运行在“裸机”上的最基本的系统软件,任何其他软件都必须在操作系统的支持下才能运行。根据使用环境和运行环境的不同,各大IT公司纷纷推出自己的操作系统,目前市场占有率最高的是微软的Windows操作系统。这里主要介绍Windows10操作系统的相关操作。
如图2-1所示,操作系统在计算机系统中位于底层硬件与用户之间,是两者沟通的桥梁。用户可以通过操作系统的用户界面输入命令
您可能关注的文档
- 《通信技术基础》课件_第7章 通信系统仿真.pptx
- 《信息技术应用》课件_项目5 WPS表格的基本应用.pptx
- 《通信技术基础》课件_第2章 信源编解码.pptx
- 《社交礼仪与交往艺术》课件_1. 礼仪初认识.ppt
- 《社交礼仪与交往艺术》课件_绪论.ppt
- 《线上线下混合式计算机图形学基础实验教程》课件_第10章.pptx
- 《线上线下混合式计算机图形学基础实验教程》课件_第4章.pptx
- 《通信技术基础》课件_第6章 频带传输.pptx
- 《通信技术基础》课件_第5章 基带传输.pptx
- 《通信技术基础》课件_第3章 复用与复接.pptx
- 人教版新课程标准高中语文选修-中国古代诗歌散文鉴赏梦游天姥吟留别 (7)教学课件PPT.pptx
- 人教版新课程标准高中语文选修-中国古代诗歌散文鉴赏李凭箜篌引 (6)教学课件PPT.pptx
- 人教版新课程标准高中语文选修-中国古代诗歌散文鉴赏春江花月夜 (8)教学课件PPT.pptx
- 18 电脑美术-“喷笔”画画 课件(38张PPT).ppt
- 20. 迷人的动画片(课件) 美术三年级上册-人教版(28张).pptx
- 9.《天然的纹理》(课件)美术三年级上册 人教版(33张).pptx
- 19 保护珍稀野生动物 课件(53张PPT).pptx
- 16 家乡的桥和塔 课件(49张PPT).ppt
- 福建省龙岩市2023_2024学年高一数学上学期第三次月考试题含解析.docx
- 安徽省2023_2024学年高一数学上学期12月分科诊断模拟联考试题含解析.doc
文档评论(0)