国内信息检索用户相关性可视化分析.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
国内信息检索用户相关性可视化分析

国内信息检索用户相关性研究现状分析 李洋 (西南大学计算机与信息科学学院 重庆 400715) 摘 要:本文采用文献计量和社会网络分析方法,从文献年代、学科、期刊来源、作者的分布以及研究主题等方面,对国内信息检索用户相关性的研究现状进行了分析。指出了我国现有研究中的不足,并给出了相应的改进建议。 关键词:信息检索,用户相关性,相关性,文献计量 Analysis of User-oriented Relevance in Information Retrieval Study of China LI Yang (College of Computer and Information Science,Southwest University,Chongqing 400715,China) Abstract:Based on the method of bibliometrics and social network analysis,the author analyzes the user-oriented relevance in information retrieval research situation of China by document’s annual distribution,discipline, source of journal,authors distribution and research themes. It points out the deficiencies of existing researches in China, and puts forward suggestions for improvement. Keywords:information retrieval,user-oriented relevance ,relevance,bibliometrics 中图分类号:G354,G353.1 1 引言 自19世纪50年代人们对信息检索相关性问题开始探讨以来[],相关性一直是信息检索领域的核心研究内容之一[],也是该领域一个非常重要的概念,得到了国内外研究人员的青睐,也取得了颇为丰硕的研究成果。从目前的研究成果来看,该领域的研究主题主要包括以下几个方面:相关性基本概念研究[]、相关性理论模型(框架)研究[]、相关性判断及其标准研究[,][]、相关性类型研究[]、相关性影响因素研究[]、相关性评价研究[]以及相关反馈研究[]等。可见,相关性研究的内容非常丰富。 目前学界已经普遍认同将信息检索相关性划分为两个研究范式,即面向系统的相关性和面向用户的相关性。用户相关性研究,对于提高检索系统的检索效率和效果有很大的现实意义和理论意义,同时对于我们更好地理解用户在不同情境下的检索需求有很大的帮助。虽然学界非常明确用户相关性研究的重要性,而且该方面的研究也在如火如荼的进行着,但是检索系统研究只能对此作无奈的观望,系统判断相关性仍然要通过词频计算等机械手段而无法利用用户相关性研究成果[]。就目前用户相关性的应用来看,相关反馈机制是最成熟的,但相关研究表明该机制虽然能够提高用户信息检索的效率[],但是在实践中用户检索信息时却很少运用[]。总体而言,用户相关性的研究取得了一定的成果,但就应用而言,情况还很不尽如人意。 今天,社会科学越来越重视用户研究,信息检索领域也不例外,虽然技术是信息检索相关性实现的基础,但是用户因素在相关性判断中也起着举足轻重的作用,随着信息检索方式从传统发展到现代,信息检索用户从专业人员普及到普通大众,当前大部分相关性研究也是面向用户展开的。基于用户相关性研究的重要性,同时为了明确国内相关研究的进展,笔者认为有必要对该领域的研究现状进行分析。 2 数据来源与处理方法 2.1 数据来源 笔者以中国期刊全文数据库(CNKI)为数据统计来源,采取的检索策略为:“SU=(用户+认知+心理+行为+情境+上下文+专家)*信息检索*相关性 OR TI=(用户+认知+心理+行为+情境+上下文+专家)*信息检索*相关性 OR KY=(用户+认知+心理+行为+情境+上下文+专家)*信息检索*相关性”,初步检索到相关文献509篇,检索日期为2015年6月。 2.2 数据处理方式 首先对检索到的文献进行处理,剔除了不相关及重复文献,接着利用Excel对检索结果进行分类汇总,将数据转化为规范化的易处理格式,然后结合文献计量学和社会网络统计分析方法,从文献的年代分布、期刊来源、作者和研究主题等方面进行分析,最后利用Sati、Ucinet软件对研究团体和关键词共现进行可视化展示并得出相关结论。 3 国内用户相关性研究现状分析 3.1 文献年代分布 对某一学科或领域的论文年度发文量进行统计分析,可以

文档评论(0)

wujianz + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档