相关反馈技术在数字图书馆信息检索中应用研究.doc

相关反馈技术在数字图书馆信息检索中应用研究.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
有关反应技术在数字图书馆信息检索中的应用研究 经典的信息检索理论认为 ,信息需求决定信息检索的 效率。网络环境下 ,信息需求的提出及表达都是由用户决定的 , 因而能够说 ,用户表达是检索效率重点性因素。实践中 ,以下两个原因会影响检索效率。 用户检索需求的不确定性。 一般认为 ,用户的检索需求总是处于不确定的状态 ,在检索过程中会由于检索结果发生变化或进行修正。 用户结构检索表达式的模糊性。在信息系统中精准的结构用户查问是特别困难的 ,因为绝大部分检索系统的标引和检索过程是不透明的 ,用户很可能不熟悉检索语言或检索式的表达 ,此外 ,用户需求与查问表达的对应变换也可能存在不一致的地方 ,所以 ,正确无误的结构反应用户真实需求的检索式并不是一件很容易的事情。 在信息检索中 ,为改良用户的检索效率 ,往往采取各样调节方法和反应途径对检索策略进行改正、扩展和完善。查问扩展就是为了知足信息需求来修正检索表达式的一系列技 术。有关反应就是其中备受关注的一种自动扩展查问方法。 有关反应技术概括 有关反应的研究历史 有关反应技术的主要思想是 :检索系统在初始查问到一 组样本文档的基础上 ,根据用户在样本文档中的有关性选择 , 结构出改良的查问表达式 ,据此再次进行检索。 这种通过调整 检索策略来增强对有关文件的响应抑制非有关文件的查问 扩展技术就是有关反应。 20 世纪 60 年代初 ,Maron 和 Kubns 指出与原始查问邻近的特点可加到查问中以检出更多的有关文件。 1971 年 Rocchio 在鉴于 SMART系统的向量空间模型中进行有关反应实验 ,显示出在比较小的测试集合检索性能有显著改良。 今后 ,有关反 馈得到了宽泛的重视 ,被扩展到了概率模型以及布尔模型中。 最近几届的 TREC实验也反应出应用有关反应技术能给检索 性能带来极大的改良。 目前 ,在知识检索、 Web 智能检索、 图像检索中 ,有关反应是一种被普遍采用的改良检索效率的方法。 有关反应的办理过程 用户向信息检索系统提交代表着其信息需求的查问表 达式 ,系统进行初始的查问 ,返回的检索结果集根据文件与查问的有关性排列 ,然后 ,用户进行有关判断 ,指出其哪些文件是有用的。 系统鉴于前一次查问检索到的文件的有关判断 ,进行有关反应 ,自动从头建立查问表达式 ,目前主要采用的方法有两 种,即检索词加权 ,提高在有关文件中出现的检索词的权值,降 低在非有关文件中出现的检索词的权值 ;查问扩展 :将有关文件中新的有用的检索词用于扩展查问。在形成新查问表达式 时,能够同时使用检索词加权和检索词选择这两种方法,也可 以任选其一。 新的“反应查问恳求” 再与文件集进行匹配 ,从其中检索出更多的有关文件和更少的不有关文件。 该过程能够循环进行 ,直到用户最终获得较为精准的查 询,并据此得到较为满意的检索结果。 带有关反应体制的信息系统 有关反应的中心技术 从有关反应的办理过程能够看出 ,检索词加权和查问扩 展中的新检索词的选择是有关反应中的中心技术。 检索词从头加权是根据查问结果文档中的有关文档和 无关文档的散布 ,从头计算查问和文档的特点权重 ,在有关文 档中的查问特点在后来的检索中相应的增加权重 ,在无关文 档中的特点相应减少权重。 查问扩展中新检索词的选择依靠于用户的有关性判断 , 在原始查问的基础上 ,结构一个新的查问。 Makoto Iwrdyana 通过试考证明用户有关反应的数量在 10~ 30 之间最为合适。 数字图书馆环境下的有关反应技术 数字图书馆环境对检索提出的要求 数字图书馆不只是是馆藏资源的数字化,而是一个海量 的信息应用系统 ,是网络社会人们学习 ,工作和生活的重要平 台。它使信息检索的方式发生了根本的变化 ,主要表现在以下几方面。 检索操作的实时性 :由于用户要直接参与检索并即时得到检索结果 ,因而对信息获取的实时性要求很高。 检索服务的个性化针对不同的用户 ,要设计出适应不同需求、友好的、 交互式的多种用户界面 ,提供一些实用的用户小工具。 检索效率的精准性 :通过对数字资源的整合 ,数字图书馆提供给用户海量的信息 ,信息资源的充足比过去任何时代都表现得突出。 这种信息应用环境下 ,用户对信息检索的正确性要求大大加强了。 有关反应在数字图书馆环境下的应用意义 数据库技术 ,网络技术及知识管理的方法给数字图书馆 的发展带来了全新的发展契机 ,取得了很大的收效 ,但纵观数 字图书馆发展的现状 ,仍存在不少问题 ,研究的事不宜迟不在于怎样成立一个数字图书馆 ,而在于怎样知足数字图书馆对检索提出的新需求 ,进而使用户轻松地从数字图书馆中获得 所需的资源 ,实现真实的资源共享。因此 ,以用户为中心 ,研究用户的需求 ,提供用户真实需要的信息是目前

文档评论(0)

187****5086 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档