数据挖掘和知识发现领域热点主题分析.PDF

数据挖掘和知识发现领域热点主题分析.PDF

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘和知识发现领域热点主题分析

第 29 卷  第 7 期 情  报  杂  志 Vol . 29  No . 7 20 10 年 7 月                             J ul .  20 10 J OU RNAL OF IN TELL I GEN CE 数据挖掘和知识发现领域热点主题分析 Analysis of Hot Spots in Fiel d of Data Mining and Knowledge Discovery 吴 思 竹 ( 中国科学院国家科学图书馆  北京  100 190 ; 中国科学院研究生院 北京  100049) 摘  要  利用词频分析 、共词聚类分析 、可视化等方法对 Web of Science 数据库 1998~2009 年间的数据挖掘和知识 发现领域的研究文献进行分析 ,探讨该领域的研究热点主题及其间关联 。 关键词  知识发现  数据挖掘  共词聚类  聚类分析 中图分类号  G350        文献标识码  A       文章编号  1002 - 1965 (20 10) 07 - 00 18 - 07   数据挖掘和知识发现是从大量数据中提取潜在 聚类工具进行聚类分析揭示领域热点词间的潜在关 的、未知的、隐含的有用信息[ 1] ,从信息过载 ,知识匮乏 联 ,分析该领域研究情况 。 中发现所需知识 。数据挖掘和知识发现本身融合了多 本文的分析数据来自从网络科学引文索引网络版 个学科的研究内容 ,也是当前各学科广泛研究的热点 Web of Science 的 SCI - EXPANDED 、SSCI 、CPCI - S 、 领域 ,是当前学者关注的研究热点之一 。范建华和李 CPCI - SSH 四个数据库的检索结果 。检索条件设定 德毅在 1998 年对数据挖掘和知识发现的技术发展进 标题为“knowledge discovery ”和“dat a mining ”, 设定论 行了综述 ,并介绍了当时的一些应用及存在的问题和 文发表时间为 1998~2009 年 ,文献类型为会议论文和 挑战[2 ] 。王敏 , 张志强[3 ] 从文献分布 、期刊 、作者 、机 期刊论文的文献数据 ,检索结果共获得 6 379 篇文献 。 构 、引文等角度对 199 1~2006 年的 SCI 数据库中的知 将包含文献标题 、关键词 、出版年 、文献类型等信息的 识发现研究论文进行了定量分析 ,其数据源主要侧重 数据导入到 SQL Server 数据库中,通过统计 、去重 ,得 [4 ] 到 6 2 11 篇文献作为分析的基础数据 。 于期刊论文 。王立伟 基于 PA KDD 学术会议和 KD nuggest s 公司统计数据对数据挖掘现状进行了综述 。 2  结果分析 本文主要是从文献计量角度 ,对来自Web of Science 的 SCI 和 SSCI 等数据库的 1998 ~2009 年的数据挖掘和  2 . 1  数据挖掘和知识发现论文类型比例及增长情 知识发现领域的期刊及会议论文利用词频统计 、共词 况分析  对数据挖掘和知识发现文献数据按其发表年 聚类方法对该领域论文研究情况进行分析 ,期望从中 份进行统计 ,数据挖掘和知识发现领域的研究文献产 探测自1998 年以来的十几年间该领域主要聚焦的研 出数量按年份分布情况见图 1 ,其数量除在 1999 年略 究热点主题的发展情况 ,供研究者参考 。 有下降外 ,在 1998 ~2008 年都

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档