- 1、本文档共50页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第8章 信息加工 8.1 信息加工概述 8.2 信息加工方式 8.3 信息加工过程 8.4 信息预处理 -8.4.1连续属性集离散化分析 -8.4.2 概念泛化分析 -8.4.3 空值与空值处理 8.5 信息加工方法 -8.5.1聚类分析 -8.5.2决策树方法 [学习目标] (1)理解和掌握信息加工的基本概念; (2)理解和掌握信息加工方式的划分; (3)理解和掌握信息加工的基本环节; (4)了解和理解信息预处理方法; (5)理解和掌握信息加工的聚类分析方法和 决策树方法。 8.1 信息加工概述 信息加工是对收集来的信息进行去伪存真、去粗取精、由表及里、由此及彼的加工过程。 这一过程将使信息增值。 要进行信息加工,首先要进行需求分析。需求分析 要考虑的问题: ① 问题研究:解决此问题需要哪些信息、使用什么 样的方法、采用什么样的形式来表达处理结果等。 ② 人机分工:哪些工作由机器处理比较方便,哪些 工作留给人做更合适。 ③ 评价标准:对加工结果进行解释,并确定如何衡 量信息加工的结果。 8.1 信息加工概述 信息加工的内容 : (1)信息的筛选和判别。 (2)信息的分类和排序。 (3)信息的分析和研究。 信息加工过程要注意以下两点: (1)要善于运用创造性思维,定性和定量结合,找出 本质的规律性的东西。 (2)要实事求是地对信息进行加工整理。 8.2 信息加工方式 1.按处理功能的深浅分 (1)预处理加工 对信息简单整理,加工出的是预信息。 (2)业务处理加工 对信息进行分析,综合出辅助决策的信息。 (3)决策处理加工 对信息进行统计推断,可以产生决策信息。 2.按处理的响应时间分 (1)实时处理型 (2)批处理型 8.2 信息加工方式 3.按系统与用户之间的距离分 (1)远程处理方式 用户通过通信线路使用远处的计算机进行处理的方式。 (2)局域处理方式 在放置计算机的地方使用计算机的方式。 4.按企事业单位的管理和计算机配置分 (1)集中式 集中式是将计算机放在单位机关等指定地方,由中心计算机 集中承担处理功能和处理量。 (2)分布式 分布式是以统一的规划为基础,将适当规模的计算机系统安 装在单位机关及其下属单位,分别承担处理功能和处理量。 8.2 信息加工方式 5.按是否运用计算机分 (1)手工加工方式 繁琐、容易出错,且其加工时间很长。 (2)计算机加工方式 利用计算机进行数据处理, 同时采用大量的数学 模型,缩短信息加工时间,提高效率,且不易出 错,满足决策需求。 计算机数据处理系统一般备有三个库: 数据库、模型库和方法库。 (核心) 8.3 信息加工过程 信息加工过程一般要经过“信息选择、预处理、数据约简与变换、信息分析与处理、评估与维护”五个环节。见图8.1。 8.3 信息加工过程 1.信息选择 信息选择的任务主要是从已有信息(如数据库、数据仓库中的信息)选择相关数据,创建一个目标数据集。 在信息选择阶段,需考虑的问题包括: (1)属性选择的客观性。 (2)数据的同构性。 (3)数据的动态性。 (4)采样策略。 (5)样本数目 8.3 信息加工过程 2.预处理 预处理的任务是根据样本数据集可能存在的问题以及处理方法对样本数据集的要求,完成以下三项任务: (1)数据校验; (2)离散化与泛化; (3)数据转换。 另外,数据预处理还包括数据的完整性和一致性检查、连续属性离散化以及属性泛化等操作。 8.3 信息加工过程 3.数据约简与变换 数据约简是通过某种方法降低算法的有哪些信誉好的足球投注网站空间。 约简常分为垂直约简和水平约简。 垂直约简是使用降维或变换方法减少变量(在信息系统中常以属性表示)数目。 水平约简是通过对对象的分析(包括离散化、泛化等),合并具有相同属性值的对象,减少对象数目。 数据变换就是对数据进行编码,使其成为分析和处理所要求的格式。 8.3 信息加工过程 4.信息分析与处理 应用相关算法从预处理过的数据中寻找隐含的对信息利用(如预测、决策等)有价值的模式。 需要考虑以下问题: (1)确定信息加工类型 确定信息加工是发现型,还是验证型等。 (2)方法选择 根据信息加工的任务,选择适当的方法。 (3)运行效率 要保证过程是有效率的。 8.3 信息加工过程 5.评估与维护 信息加工的主要目的是支持预测和决策,因此确定处理结果的可信度、对结果进行必要的
文档评论(0)