论数据仓库和数据挖掘技术的构件库管理系统.doc

论数据仓库和数据挖掘技术的构件库管理系统.doc

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
论数据仓库和数据挖掘技术的构件库管理系统 【摘要】:通过较为成熟的数据仓库和数据挖掘技术存储和检索构件信息。数据仓库中不仅存储了构件实体,还存放有构件的描述信息、构件的复用历史信息、构件的用户反馈信息。通过数据挖掘技术在构件仓库中查找构件,为用户提供高效、准确的构件查找和辅助选择方案,为构件复用成功提供了有效的技术保障。【关键词】构件;构件仓库;数据挖掘;反馈;决策树作者 简介:陈文,23岁,男,四川南充人,软件工程师,重庆西南大学计算机与信息科学学院2005级硕士研究生,研究方向:软件测试,软件复用。1引言软件构件技术是软件复用的一种重要手段,是近年来软件复用研究的热点,目前出现了大量的基于构件的应用软件开发,取得了良好的效果。要使用基于构件的软件开发技术,发挥构件在软件重用方面的优势,就必须要有支持整个软件生命周期并包含有大量可用构件的构件库系统,有效的构件管理和高效的构件查询是构件库系统成功的关键。本文研究的重点是将数据仓库,数据挖掘技术应用到构件库系统中,为构件库管理员提供切实有效的构件管理方法和为用户提供高效的构件查找方法和构件选择的辅助决策支持。2数据仓库与数据挖掘技术2.1数据仓库技术著名的数据仓库专家W.H.Inmo在其著作《BuildingDataWareHouse》一书中给出了如下的数据仓库的定义:数据仓库是面向主题的(Subject-Oriented),集成的(Interated),时变的(Time-Variant),非违约的(Non-volatile)一系列用于管理和决策制定的数据集。面向主题是数据仓的重要特征,这是与传统数据库面向应用相对应的。主题是一个在较高层次将数据归类的标准。基于主题组织的数据,被划分为各自独立的领域,每一个领域有自己的逻辑内涵,互不交叉,数据只是为具体处理而组织在一起。传统的E-R型数据模式能较好的执行联机事务处理(OLTP),但不适应决策支持分析,而数据仓库则是为决策管理提供支持信息,根据业务需求从用户的角度基于主题来组织数据,并形成相应的数据视图,汇总表等,因此适于联机分析处理(OLAP)。数据仓库的第二个特点是集成化,数据从面向应用的操作环境中,提取到数据仓库中时,都要经过集成化,统一原始数据中的所有矛盾如命名冲突,数据结构转换等,最终达到:一致的命名,变量度量,编码结构,物理属性等。数据仓库的另一个特点是非违约性。因为数据仓库中的数据是历史数据,数据经集成进入数据仓库后,一般不需要改变。针对数据进行的基本操作只是装数据和访问数据,因此不存在传统数据库中的数据恢复,数据同步,修复死锁等复杂问题.2.2数据挖掘技术概述数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的非平凡过程,这些信息的表现形式为:规则、概念、规律及模式等。它可帮助决策者分析历史数据及当前数据,并从中发现隐藏的关系和模式,进而预测未来可能发生的行为。3当前构件库系统应用中的困难随着构件库系统的发展,当构件数目逐渐增多时,用户在查询和选取构件时会碰到以下一些困难:(1)在查询的过程中,可能有多个满足用户查询条件的构件,如何快速有效地从众多的候选构件中,准确的判断并选取所需的构件,这是一个复杂的决策过程,一般都依赖于用户的复用经验,以及对构件的理解和主观判断。(2)通常用户都是通过刻面、属性、关键词、关系等表达式,根据所需构件的特征,进行构件的查询。然而访问构件的用户具有不同的层次,可能不熟悉构件的刻面分类模式,对构件的理解比较困难。(3)用户查询前并没有一个明确的目标,只是想通过查询构件库,找到能够利用和复用的构件,因而,如何通过构件的复用历史和其它用户的览胜经验,为用户提供一定程度的复用帮助是很必要的。(4)对需求规约、设计、模式、测试计划等文档知识的构件复用属于间接复用,需要复用者首先进行分析和理解。在大多数复用情况下,对构件的复用是白盒复用,也是就根据构件复用者的反馈,对构件进行适应性修改。如何跟踪软件复用的经验和构件的使用历史,辅助用户选取相应的分析,设计及改动最小的构件是关键。综上所述,由于当前的构件描述多是基于构件某一方面特征,如构件接口、构件属性、运行环境等进行描述,而缺乏对构件的功能及非功能属性的精确的,形式化的语义描述,这将导致某一候选构件与需求构件在构件的描述匹配中完全一致,但该构件并不一定能完成需求的功能。例如,用户试图寻找一个计算两数相加输出和的加法构件,但候选的是一个计算两相乘输出积的乘法构件,需求构件与候构件在构件接口参数描述、环境依赖等方面完全匹配,但功能上却大相径庭。因为缺乏非功能属性上描述,当前的构件匹配也存在着即使候选构件与需求构件在功能上一致但由于在非功能属性上不

文档评论(0)

mcplj198370003 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档