基于全文本共引分析信息资源聚合方法与应用研究毕业论文开题报告.doc

基于全文本共引分析信息资源聚合方法与应用研究毕业论文开题报告.doc

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于全文本共引分析信息资源聚合方法与应用研究毕业论文开题报告

研究生学位论文开题报告 学 院: 专 业: 学 号: 姓 名: 导师姓名: 导师职称: 2014年 9 月 24 日 基于全文本共引分析的信息资源聚合方法与应用研究 一 选题背景与研究意义 选题背景 共引分析的发展 16世纪后期,论文引用,成为的第二特征是合理进行学术科研交流的部分[][]和苏联情报学家I.V.Marshakova提出了共引的概念,之后,国内外众多学者纷纷利用SCI、SSCI等检索工具进行共引分析。共引分析已经成为一种普遍的文献计量分析方法,其不仅可以用来揭示科学结构的发展及变化,在研究前沿分析、领域分析、科研评价等方面得到了很大的应用。 传统的引文分析以科学文献中的脚注或尾注形式的参考文献(引文)为数据源,通过统计其被引频次分析作者、文献以及期刊的学术影响力。然而,传统的研究套路忽略了引文在文献中的具体引用情况(比如引用次数、引用位置和引用语境等)以及作者的引用动机等重要信息。在进行共引分析时,共引频次计算没有共引。全文数据直接对引用位置、引用内容等,通过就可以自动抽取标识信息得对大样本数据的有效分析且容易。全文数据难以获取,随着发展,全文数据的获取变得越来越容易PubMed已提供数据lsevier和Wiley也都开始提供全部或部分XML格式的全文阅读和下载。利用全文数据来进行细粒度的共引分析,将成为引文分析发展的必然方向。 知识经济社会的发展 进入二十一世纪,科技的进步、社会的发展使得我们已经进入一个全新的知识经济时代,深化知识服务,营造高效的知识传递与交流环境,已经成为信息服务业和知识经济发展的迫切需求。随着互联网技术的发展,科学文献出版量的日益剧增,信息资源存在载体形式不同、来源不同、语义丰富、学科各异等特点,如何在复杂的信息资源之间建立起有机联系,对信息资源进行深层次的揭示、聚合,进而为信息资源用户提供知识服务,已成为当今图书情报界的热点研究问题。如何揭示和实现信息资源基于知识层面上的关联,最终实现知识服务,更好地满足用户的需求,显得十分重要。 聚合是对信息资源聚集和融合的一个过程,聚集是指将不同类型的信息资源聚集整合,融合则是将信息资源进行深层次的理解和认识并有机地整合(基于内部关联)在一起。信息资源可以看成是文献、学者及他们之间的关联所形成的一种知识网络体系,其关联可以有多种测度方式,从信息计量学出发,可以利用知识单元件的共现来测度,而共引关系就是共现的一种。利用信息资源知识单元间的这种内部关联对信息资源进行聚合,对于发现学者、文献之间的共同研究主题、研究方法及知识交流模式,进而揭示科学结构的发展及变化都有着重要的理论和实践意义。 研究意义 通过国内外文献调研发现,国内外利用全文数据进行共引分析的研究很少,将其与聚合研究相结合的研究更是没有。本文对国内外基于全文数据的共引分析的理论和方法进行介绍,并将其引入到信息资源聚合当中,最后利用实际数据加以应用,具有一定的理论意义和实践意义,具体表现如下: 有利于共引关联强度算法的改进 传统的共引分析关系频次计算。共引距离统一标准,。 有利于促进知识服务水平 通过基于共引关系的资源深度聚合,优化信息资源的知识组织,促进知识流动,能够显著提升知识服务的能力和水平。 二 国内外研究现状 通过对国内外文献的研读,笔者认为国内外对本领域的研究主要包括以下几个方面: 全文本引文分析研究 全文数据运用于引文分析已数十年历史,在前期,由于全文数据的不易获取和难以解析,研究多依赖于手工操作,研究样本,研究,一些数据库开始提供的全文数据后研究越多研究也从前期的手工操作逐渐自动化发展。有mall H、陈超美研究一部分集中行为研究通过引进行分析,Garfield在1962年运用文献全文引用分类研究[]另一部分集中量化研究,主要是通过引位置引用频次研究, Voos 与 Dagaev的研究[]以及McCain 与Turner的研究[]。频次分析、频次 引文分析通过统计引文频次来分析作者、文献以及期刊的学术影响力,然而引文与引用并不是一一的,可以文献引用零引用,一个引用位置也引用多篇引文被引用多次参考文献施引文献具有更重要的而一个位置引用多篇文献说明引用的可靠性科学创作中这种引文与引用之间的多对多关系是的arfield、Bornmann和MacRoberts兄弟等引文分析开创者频次可靠性提出质疑,单纯使用引文来评价是局限性的还应该考虑引文被提及的次数Herlach 认为文献的提及引文与施引文献联系的特征之一[]Voos 和 Dagaev认为引文对施引文献的影响可以用引用次数来约有引用等美国社会信息科学和技术研究发现参考文献平均引用[];胡志刚[]等ournal of Informe

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档