- 1、本文档共2页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于层次结构的一种数据预处理设计.pdf
2005年 1月 湖南经济管理干部学院学报 Jan.,2005
第 16卷第 1期 JoumalofHumanEcononffcManagementCollege Vo1.16No.1
基于层次结构的一种数据预处理设计
王 羽
(南京工业大学,江苏 南京 210000)
[摘 要]数据预处理工作对于进行成功的数据挖掘具有重要的价值和意义。针对数据预处理过程的设计,采用现在普遍
应用的面向对象程序设计方法,运用类层次体系结构来进行数据挖掘的预处理工作。本文针对系统分层构架的设计以及基于该
构架的数据装载与数据预处理子系统的设计做一个较为详细的研究。
[关键词]数据顸处理;层次结构;数据挖掘
[中图分类号]TN919.3 [文献标识码]A [文章编号]1008—939X (2005)01—0108—02
数据挖掘技术将会是未来的技术热点,大量信息在给人们 类层次体系结构提供了一种准则,即一个给定的类层次可
带来方便的同时也带来了一大堆 问题:第一是信息过量,难 以 以和哪几个类层次交互,怎么交互。这种方法提高了所创建系
消化;第二是信息真假难以辨识;第三是信息形式不一致,难以 统的可扩展性、可维护性和可移植性 。
统一处理。面对这些问题,数据挖掘和知识发现 (DMKD)技术 本例提供一个五层类层次体系结构,这五层类层次分别为
应运而生,并显示出强大的生命力。数据挖掘是指一个完整的 用户界面类型、控制 /处理类型、业务/领域类型、持久化类型和
过程,该过程从大型数据源 中挖掘先前未知的,有效的,可实用 系统类型。用户界面类层由实现屏幕界面各组成元素(如菜
的信息,并使用这些信息做出决策或丰富知识。 单、按钮等)和报表的类组成。系统的业务行为由业务 /领域类
数据挖掘的一般过程为:数据的选择,数据的预处理,数据 层和控制处理类层完成。业务/领域类实现与业务领域相关的
的转换,数据挖掘,结果分析和知识的同化。在整个数据挖掘、 一 些概念,重点在于业务对象的数据部分和各个对象特有的行
探查过程 中,数据预处理工作对于进行成功的数据挖掘具有重 为。持久化类封装了存储、检索和删除对象的功能,隐蔽了相
要的价值和意义。针对数据预处理过程的设计,我们采用现在 应的存储处理技术的细节。系统类则提供了操作系统的底层
普遍应用的面向对象程序设计方法,运用类层次体系结构来进 功能,通过包装这些底层功能,使得应用系统与操作系统相隔
行数据挖掘的预处理工作,下面就对系统分层构架的设计以及 离,提高了应用系统的可移植性,即与操作系统的无关性,以实
基于该构架的数据装载与数据预处理子系统的设计方法做一 现跨平台应用。所有层的类都可以和系统层交互,系统层实现
个较为详细的分析介绍。 了基本的软件功能。
一 、 数据预处理系统的分层逻辑架构 二、数据预处理系统分层架构静态模型设计
f#一}—— 墨 r]『.1— 敦籍舒
}
r———————————1 / ; L—— ! — 一 { 础
j t l/ — 、、 鐾_—耆 }
您可能关注的文档
- 基于Lab颜色空间的运动目标检测.pdf
- 基于LGO的大型稀疏线性方程组的消“元”法.pdf
- 基于MATLAB的SOM网络的干旱聚类分析.pdf
- 基于Matlab的STM32软件快速开发方法.pdf
- 基于Matlab的自组织神经网络在油气层识别中的应用研究.pdf
- 基于OMP算法的极化敏感阵列多参数估计.pdf
- 基于OWL的成语典故本体构建研究.pdf
- 基于PLC技术的嵌入式视频监控系统设计.pdf
- 基于ROI-KNN卷积神经网络的面部表情识别.pdf
- 基于SamArmDvk 9 2开发板的WINCE系统定制与安装.pdf
- 《GB/T 32151.42-2024温室气体排放核算与报告要求 第42部分:铜冶炼企业》.pdf
- GB/T 32151.42-2024温室气体排放核算与报告要求 第42部分:铜冶炼企业.pdf
- GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法.pdf
- 中国国家标准 GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法.pdf
- 《GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法》.pdf
- 《GB/T 18238.2-2024网络安全技术 杂凑函数 第2部分:采用分组密码的杂凑函数》.pdf
- GB/T 18238.2-2024网络安全技术 杂凑函数 第2部分:采用分组密码的杂凑函数.pdf
- 《GB/T 17215.686-2024电测量数据交换 DLMS/COSEM组件 第86部分:社区网络高速PLCISO/IEC 12139-1配置》.pdf
- GB/T 13542.4-2024电气绝缘用薄膜 第4部分:聚酯薄膜.pdf
- 《GB/T 13542.4-2024电气绝缘用薄膜 第4部分:聚酯薄膜》.pdf
文档评论(0)