自组织数据挖掘方法-mipaper.pdf

下载文档 降价啦

22
0
约15.57万字
发布于天津
举报
版权申诉
保障服务
文档已下架，其它文档更精彩

自组织数据挖掘方法-mipaper.pdf

1、本文档被系统程序自动判定探测到侵权嫌疑，本站暂时做下架处理。
2、如果您确认为侵权，可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理，应急电话：400-050-0827。
3、此文档由网友上传，因疑似侵权的原因，本站不提供该文档下载，只提供部分内容试读。如果您是出版社/作者，看到后可认领文档，您也可以联系本站进行批量认领。

自组织数据挖掘方法-mipaper

自组织数据挖掘方法从数据中提取信息的理论方法及应用谨以此书献给 GMDH 理论之父 A. G. Ivakhnenko 教授八十五岁寿辰 * * * * * * 序随着信息技术的飞速发展如今几乎人类活动中每一个领域都充斥着大量的统计测量数据曾经广受赞誉的管理信息系统 MIS 和决策支持系统 DSS 在如山的数据面前其局限性也日益显露因为它们只能提供大量的数据而不能从数据中提炼出足够的直接可用的知识信息因此发现总结数据规律提取出数据中所蕴含的信息已经成为了辅助决策的重要组成部分而这一从数据到信息和知识的过程被人们形象地称为数据挖掘 Data Mining 目前已有众多不同的数据挖掘方法笔者认为一种好的数据挖掘方法首先应该使数据挖掘过程的自动完成以排除人们主观认识对建模结果的影响近年保证数据挖掘的客观性另一方面人们对数据挖掘的兴趣通常只在于最后的结果因此一种好的数据挖掘方法不应该要求用户精通数学控制论统计学等理论也不应要求用户花大量时间去处理一个对话框接一个对话框的复杂数学建模软件目前已经有一些数据挖掘方法在不同程度上实现了智能化建模如模糊建模方法神经网络遗传算法等等其中人工神经网络方法在近年倍受瞩目但是它有着如下的缺点神经网络模型只能得出结果而不能解释结果它从数据中提取出的信息仍然隐含在网络结构中神经网络没有一种系统地构造网络结构的方法建模者必须反复试验很多神经网络的训练算法在速度和拟合效果上往往还不及统计计算方法当样本数据存在噪声时神经网络模型常发生过度拟合现象为克服神经网络这些不足我们的方法是将遗传算法作为一项外部过程来优化网络结构同时加上一些修正措施以防止模型的过拟合本书介绍了网络构建的进化遗传变异选择原理在这个原理下由一个简单的初始结构开始可以产生一系列具有某种进化特征的模型这一系列模型的复杂性逐步递增而复杂性递增的每一步都是在大量待选模型经适者生存的选择后获得的不断地产生选择淘汰和进化直到最优复杂性的模型被选出为止这些模型对应着由活动神经元构成的神经网络随着模型的进化这一树状网络也不断生出枝节网络的层数层间节点数都不需用户指定整个建模过程是一个完全自组织的过程也是为此我们将其命名为自组织数据挖掘方法自组织数据挖掘方法能够自动确认模型的参数和结构产生最优复杂性的模型所谓最优复杂性即当数据噪声存在时对已学习过的数据集上的拟合精度和对未经学习的数据的预测分类等能力之间的一个最优平衡点最优复杂性解决了拟合精度不高的问题也避免了模型对数据噪声的过拟合使得自组织数据挖掘方法较其它所有数据挖掘方法更加的智能快捷和高效自组织数据挖掘方法与一般神经网络方法的区别在于前者是一种统计学习网络具有归纳的功能最早的统计学习网络算法成组数据处理算法 GMDH 由乌克兰控制论学家A. G. Ivakhnenko 在 1967 年提出 70 年代 Barron 提出的多项式网络训练算法 PNETTR 和 80 年代 Elder 提出的多项式网络综合算法 ASPN 是其发展过程中两个重要里程碑这两项成就把自适应学习网络和 GMDH 算法结合到了一起在软件 KnowledgeMiner 中具体实现了目前必威体育精装版的理论和算法进展这些在本书中亦有详述 KnowledgeMiner 是一款功能强大而易用的自组织建模和预测软件它内置三项必威体育精装版自组织建模技术 GMDH 算法模拟复杂性算法和模糊法则的自组织归纳算法对 GMDH 算法又有三项工具活动神

您可能关注的文档

知传链电子书

文档评论（0）

zhuwo + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

自组织数据挖掘方法-mipaper.pdf