网站大量收购独家精品文档,联系QQ:2885784924

软件数据挖掘的干问题研究.pdf

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
软件数据挖掘的干问题研究

软件修改历史模式的研究与应用 软件数据挖掘若干问题研究 研究生:吴戴林 导师:张师超、袁鼎荣 专业:计算机软件与理论 方向:数据挖掘 年级:2006 级 摘 要 关系数据库在1972 年诞生后,数据库技术便取得了飞速的发展。随着数据 库管理系统的广泛应用,人们收集数据的能力有了巨大的提高,积累的数据也越 来越多。这些海量的数据中潜藏着大量重要的、有趣的信息。然而这些隐藏在海 量数据中的有趣信息是很难被人们发现,所以许多学者都在研究如何从这个海量 数据源中快速高效地获取有趣信息。由于传统的统计学分析方法已经不能够满足 目前的需要,于是数据挖掘技术便应运而生。 数据挖掘(Data Mining)是人工智能与数据库领域当前研究的一个热点,引起 了大量学者与专家的关注。数据挖掘有许多功能,比如关联分析、聚类分析、例 外分析等,与之相关技术的应用也非常成熟。利用这些成熟的数据挖掘技术[1] 研究软件工程数据是本文的主要研究内容。一个软件工程在其周期里面会产生许 多数据(如文档,源代码,代码库,配置文件等),当然这些数据中也隐藏着许 多有用的信息。这些信息可以帮助程序员发现代码中的存在但是没有在当前系统 中出现的潜在bug 、更好的模块化系统、重构遗留系统、以及增加系统的稳定性、 健壮性和可靠性等。软件工程数据挖掘在进几年受到了许多学者的关注,他们也 提出了许多算法帮助程序员更好的了解软件数据。本论文的工作主要由以下几个 内容组成: (1)数据挖掘和软件数据模式挖掘综述。对当前主要的数据挖掘技术以及 应用做简要的叙述,接着从软件工程学的角度出发,分别从需求、文档、开发、 测试、维护等五个方面阐述数据挖掘技术在软件工程中的应用。包括各个方面的 经典算法,以及将来比较有挑战性的难题等。 (2 )系统运行时的有趣操作模式研究。软件系统在运行时会产生很多的运 行日志,它记录系统所产生的所有行为,如用户操作历史,错误信息等,并按照 某种规范表达出来。系统维护人员可以根据这些日志(如错误修复,负载均衡等) 来维护系统。我们收集系统在运行时产生的操作流程日志,利用数据挖掘技术分 析这些日志,从中找到有趣的知识。在这部分将讨论数据挖掘技术如何从运行日 志中发现有趣的知识。 (3 )软件修改历史数据中的模式发现和软件代码(software repositories)bug 检测技术研究。随着信息技术的发展,软件系统越来越大,代码量螺旋式的增长, I 软件修改历史模式的研究与应用 从而程序中的bug 和错误的出现是不可以避免的,这些bug 和错误不仅增加了维 护难度,也增加了软件的成本花费。软件开发人员对软件进行维护的时候,往往 会出现这样的情况:由于模块之间存在依赖性,修改软件的一个小模块,通常都 [2] 需要修改与之相关的模块,这种依赖性很难用传统的动态或静态分析技术 进行 检测。本文通过数据挖掘技术来研究软件修改历史中的模式,即发现那些经常会 一起被修改的代码。这些模式可以帮助软件开发人员发现模块间的依赖性,通过 这些依赖性来检测代码潜在的bug 。当软件开发人员对软件代码的某个地方进行 修改时(假设执行一次维护任务),我们的方法可以有效的为其提供与本次维护 有关的其它代码,即软件修改历史模式。 (4 )最后对本文所做的工作进行总结,包括本文的创新点、不足之处,以 及本文进一步工作的展望。 关键词:数据挖掘,软件工程数据挖掘,有趣活动,软件修改历史模式 II 软件修改历史模式的研究与应用 Studies on Software Data Mining Name: Dailin Wu

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档