基于模块抽取的数据挖掘算法选择决策支持系统.docx

基于模块抽取的数据挖掘算法选择决策支持系统.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
T. Man et al. / Procedia Computer Science 186 (2021) 529–537 PAGE 535 PAGE 536 T. Man et al. / Procedia Computer Science 186 (2021) 529–537 基于模块抽取的数据挖掘算法选择决策支持系统 摘要 各种领域都需要数据挖掘技术。然而,大多数数据研究人员没有足够的知识和经验。由于用于数据分析的大量算法和参数,基于直觉的决策不能导致最优解。本体被广泛用于构建知识驱动的决策支持系统,因为它适合封装与各种领域相关的概念和术语关系。它适用于通过计算机获取知识,允许在必要时共享和重用知识。所有关于数据分析的概念和关系都可以用网络本体语言来描述。它的推理机制在任何基于知识的系统中都是至关重要的。通过考虑数据特征和任务需求,可以推理出本体,为特定的分析任务推荐合适的解决方案。在之前的工作中,我们已经开发了一个描述关于数据挖掘的综合知识和逻辑内部关系的系统。我们发现大规模本体的推理和查询复杂度较高,因此本文重点研究了基于本体的数据挖掘算法选择决策支持系统的建模和实现,该系统包含一种新的子本体抽取方法。提取有效内容可以显著减小本体的大小。这种抽取方法可以在保证信息质量的前提下提高查询效率。 关键词:决策支持系统;数据分析;本体;模块提取; 1。 介绍 在大数据时代,数据挖掘技术允许从各个领域的真实数据中提取知识。在实际应用中,困扰用户的一个关键问题是没有指南来帮助选择正确的解决方案。初学者不知道哪些算法适用于哪些环境。现实生活中的数据复杂多样,因此不同的算法适用于不同的情况。专家根据他们的经验建立数据处理过程。现实生活中的数据复杂多样,因此不同的算法适用于不同的情况。专家根据他们的经验建立数据处理过程。显然,迫切需要一个决策系统来为数据分析任务提供支持。 通过算法/模型选择,提出语义元挖掘用于数据挖掘优化。它提供了一个合适的描述框架来明确数据挖掘过程中不同阶段的任务、数据和算法之间的复杂关系。本体是一种计算机可理解的描述语言。自然,它已经成为为各种应用场景构建DM智能助手时的一种选择。 在之前的工作[15]中,我们基于“语义元挖掘”的概念,提出了一个数据挖掘本体作为数据挖掘算法选择的决策支持系统框架。数据挖掘本体包含一个“输入”本体,用于描述数据特征和任务需求,这是选择合适算法的基础。 我们还对现有的数据挖掘本体进行了重构和整合,以呈现相关知识。 但是在实际应用中,我们发现由于核心DM本体的规模较大,查询的执行需要花费大量的时间。因此,我们提出了一种子本体抽取方法来抽取本体所需的模块。1个节目。提取的模块尺寸较小,因此查询执行速度加快。为了简化抽取过程,我们重新构建了数据挖掘核心本体的结构。本体结构有如下改进。我们已经从一个复杂的网络结构重构为一个多层次的结构。然后我们将其统一为从输入开始的自下而上的提取过程。 图。1.数据挖掘算法选择决策支持系统的设计 本文的主要贡献包括重新构建数据挖掘本体和降低查询复杂度的子本体抽取方法。提出的子本体抽取方法是基于OWLAPI实现的。在实际应用中,查询效率显著提高,因为提取方法减小了本体的大小。 本文内容如下:第二节介绍了相关工作。第三节讨论了对已提出的数据挖掘本体结构的改进,第四节介绍了子本体的提取方法.在第5节中,我们介绍了所提出的决策支持系统的基本用法。最后,第六节给出了结论。 2。 背景 有许多关于支持数据挖掘过程的研究。语义元挖掘[1]通过查询知识库中的数据挖掘专业知识来挖掘数据挖掘元数据。它不同于一般的数据驱动的元学习。语义元挖掘基于相关知识和内部关系。最近,已经开发了许多智能助手来优化DM过程。比较研究在[2,3]中讨论。许多数据挖掘本体也被设计来帮助用户构建数据挖掘过程。 2.1。 数据挖掘本体 Panov等人。提出了一种数据挖掘本体OntoDM,它包括基本DM实体的形式化定义[4,5]。该定义基于由de roski[6]提出的通用数据挖掘框架。该本体是最早用于数据挖掘的深度和重量级本体之一。但它只是用于对DM知识的描述,所以没有涵盖算法特性。为了允许结构化挖掘数据的表示。开发了一个单独的本体模块,名为OntoDT,用于表示关于数据类型的知识[7]。Hilario等人。提出数据挖掘优化本体(DMOP) [8],它为分析数据挖掘任务、算法、模型、数据集、工作流和性能指标以及它们之间的关系提供了一个统一的概念框架。他们在DMOP使用一系列定制的特殊目的关系。本体面向语义元挖掘,但DMOP的结构过于复杂,对非专业用户不友好。目前还存在其他几种数据挖掘本体,如知识发现(KD)本体[9]、KDDONTO本体[10]、数据挖掘工作流(DMWF)本体

您可能关注的文档

文档评论(0)

真情无限 + 关注
实名认证
内容提供者

我喜欢上网,喜欢上有哪些信誉好的足球投注网站分享一些有价值的资源。

1亿VIP精品文档

相关文档