- 1、本文档共42页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
属性约简2元组
6.2.3仿生物技术的神经网络方法 1. 前馈式网络 它以感知机、BP反向传播模型、函数型网络为代表。此类网络可用于预测、模式识别等方面。 2. 反馈式网络 它以Hopfield的离散模型和连续模型为代表,分别用于联想记忆和优化计算。 3. 自组织网络 它以ART模型、Kohonen模型为代表。它们用于聚类。 6.2.4 仿生物技术的遗传算法 (1)繁殖(选择) 从一个旧种群(父代)选择出生命力强的个体产生新种群(后代)的过程。 (2)交叉(重组) 选择两个不同个体(染色体)的部分(基因)进行交换,形成两个新个体。 (3)变异(突变) 对某些个体的某些基因进行变异(1变0,0变1),形成新个体。 在工程和科学数据库中对若干数据项(变量) 进行一定的数 学运算,求得相应的数学公式。 1.物理定律发现系统BACON BACON发现系统完成了物理学中大量定律的重新发现。 2.经验公式发现系统FDD 我们研制了FDD发现系统,寻找由数据项的初等函数或复合 函数组合成的经验公式。 6.2.5 数值数据的公式发现 6.2.6 可视化技术 可视化技术是一种图形显示技术。例如,把数据库中多维数据变成多种图形,这对于揭示数据中内在本质以及分布规律起到很强的作用。对数据挖掘过程可视化,并进行人机交互可提高数据挖掘的效果。 可视化数据挖掘是创建可视化的数据挖掘模型,利用这些模型发现业务数据集中存在的模式,从而辅助决策支持及预测新的商机。 6.3 数据挖掘的知识表示 6.3.1 规则知识 6.3.2 决策树知识 6.3.3 知识基(浓缩数据) 6.3.4 神经网络权值 6.3.5 公式知识 6.3.6 案例 6.3.1 规则知识 规则知识由前提条件和结论两部分组成 前提条件由字段项(属性)的取值的合取(与?) 和析取(或?)组合而成。 结论为决策字段项(属性)的取值或者类别组成。 例如:上例的人群数据库,按ID3方法得到的决策树如下: 6.3.2 决策树知识 例如上例的人群数据库,通过属性约简计算可以得出身高是不重要的字段,删除它后,再合并相同数据元组,得到浓缩数据如下表: 6.3.3 知识基(浓缩数据) 6.3.4 神经网络权值 神经网络方法经过对训练样本的学习后,所得到的知识是网络连接权值和结点的阈值。一般表示为矩阵和向量。 例如,异或问题的网络权值和阈值分别如图6.4所示。 输入层网络权值: 隐节点阈值: 输出层网络权值: 输出结点阈值: φ=0. Z y2 x1 x2 ?1 y1 T1 T2 w11 w22 ?2 ? w12 w21 例如,太阳系行星运动数据中包含行星运动周期(旋转一周所需时间,天),以及它与太阳的距离(围绕太阳旋转的椭圆轨道的长半轴,百万公里),数据如下表: 发现的公式为:d3/p2=25 6.3.5 公式知识 数据挖掘原理 6.1 知识发现过程 6.2数据挖掘方法和技术 6.3 数据挖掘的知识表示 6.1知识发现过程 6.1.1知识发现过程定义 知识发现(KDD):从数据中发现有用知识的整个过程。 数据挖掘(DM) :KDD过程中的一个特定步骤,它用专门算 法从数据中抽取模式(patterns)。 KDD过程定义: 从大量数据中提取出可信的、新颖的、有用的并能被人理解的模式的高级处理过程。 “模式”可以看成是“知识”的雏形,经过验证、完善后形成知识。 数据源 数据 数据集成 目标数据 预处理后 数据 转换数据 模式 知识 数据选择 预处理 数据挖掘 数据转换 结果表达和解释 数据准备 数据挖掘 结果评价 KDD过程 1.数据准备 目标数据(Target Data),是根据用户的需要从原始数据库中选取的一组数据。数据预处理一般包括消除噪声、推导计算缺值数据、消除重复记录等。数据转换的主要目的是完成数据类型转换。 尽量消减数据维数或降维,以减少数据挖掘时要考虑的属性个数。 2.数据挖掘 首先要确定挖掘的任务或目的,如数据分类、聚类、关联规则发现或序列模式发现等。 确定了挖掘任务后,就要决定使用什么样的挖掘算法。
文档评论(0)