文献检索效力的影响成分及其改良方法2.doc

文献检索效力的影响成分及其改良方法2.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
文献检索效力的影响成分及其改良方法2

文献检索效率的影响因素及其改善方法 文献检索的目的是全面、准确地为用户提供所需文献。但是,从用户角度来看,在检出的文献中可能会夹杂着一些不符合提问要求的文献(即误检文献);反之,在未检出的文献中也可能存在着少量符合提问要求的文献(即漏检文献)。由于用户的看法和需要不同,对检出文献是否满足要求的相关性(即实用性)评价也可能不同。因此,文献的相关性评价在某种程度上带有主观性。尽管如此。仍可作为评价文献检索效率的基础。所谓检索效率简单地说,是指检索系统提供库存相关文献、满足用户的程度。文献检索效率一般按照以下标准来评价:1文献库收录范围;o查全率和查准率;?响应时间;?费用等。其中查全率和查准率是重要的也是最常采用的技术标准。在现代的文献检索系统中,查全率一般为60一70%,查准率为40一50%。由于查全率和查准率之间存在着互逆关系,如果进一步提高查全率(超过70%),只能靠降低查准率来达到,反之亦然。因此,对任何一个文献检索系统来说,要求得到查全率和查准率均为1的答案,实际上是不可能的,必须按照用户的要求选择最佳的查全率和查准率的比例关系。影响检索效率的因素实践表明,影响检索效率的因素是多方面的,主要与文献标引的质量、主题词表的 质量和检索式编写等因素有关。 (一)标引质量 标引指的是对文献或提问进行主题分析、给出检索标识(主题词、分类号等)的过程。其目的是按照给定的检索标识组织各种检索工具(例如,目录、索引或机读文档等)。因此,文献标引质量不仅与组织检索工具有关,而且是影响检索效率的主要因素之一。 1.衡量标引质量的标准 标引质量可以理解为标引文献或提问时给出主题词的正确性和全面性,表现在文献的引得深度。按照兰卡斯特的定义“引得深度是指标引的网罗性和主题词的专指性”的总称,据1966一67年期间使用MEDLARS系统所得到的文献检索效率表明,漏检相关文献数的20%是由于引得深度不够造成的。因此,我们可以将标引的网罗性和主题词的专指性做为评价标引质量的标准。(1)标引的网罗性是指标引时揭示文献主题内容的广度而言。如果对文献内容分析得愈深透,标引得愈全面,那么检索时相关主题的文献就能都检索出来,因而查全率较高。例如,查找题为“计算机检索软件设计”方面的文献,经过文献主题分析后选出计算机,情报检索、程序设计三个词。从标引的广度或包含检索角度来看,还应补加:程序系统和应用程序二个词。另一方面,如果标引的网罗性太高,那么检出的文献中就会渗杂着较多的非相关文献,查准率就会降低。因此,标引网罗性是影响查全率的重要因素之一。(2)主题词的专指性。主题词的专指性是指其表达主题的深度而言。标引时,如果选用专指性强的主题词愈多,则检索时检 出的文献针对性愈强,查准率就愈高。仍以“计算机检索软件设计”问题为例,标引时除选用“计算机”一词之外,还应选用“电子计算机”一词。使用前一词可以实现包含检索,查全率较高,使用后一词可以实现特性检索,查准率较高。因此,主题词的专指性影响查准率的重要因素之一。怎样掌握标引的网罗性和主题词的专指性,以达到所需引得深度,应根据检索系统任务和数据库特点而定。 2。标弓!质量的影响因素 由于人们专业知识和工作经历不同,在标引的网罗性和主题词专指性方面,很难达到标引的一致性,同时也很难避免产生错误。所谓标引的一致性是指几个人同时标引一篇文献或一个人在不同时间内标引同一篇文献所选用主题词的一致程度。 (1)网罗性不当 例如,对文献题为“空气、土壤、对流层中氢一226的积累”标引时,如果不选用表示环境的主题词“空气、土壤、对流层”,而只选用表示氢移动的“降水”一词,则网罗性很低,检索时必定漏检相关文献,查全率降低。 (2)用词不当、漏掉重要词 例如,对文献题为“调整加速器中气体流速阀的性能”标引时,只选用“阀”作标引词,而未选用作为使用对象的“加速器”,,76,或者选用“气体”、“流体”之类的不适当的词,而漏掉“气体流、流量”之类的重要i司,检索时就会产生漏检和误检,结果降低查全率和查准率。当然,标引时人们还会做出其他错误,影响标引质量。 (二)主题词表质量 主题词表的质量主要表现在词表结构和词汇特点方面。词表结构由款目词、词间关系及其有关数据组成。款目词按其字顺排歹lJ,以便于检索。词间参照关系一般分为同义关系、等级关系和相关关系。同义关系的作用是当某一概念采用不同词时用来确定采用的词。借以提高查准率,等级关系和相关关系的作用是推荐主题词、扩大标引范围,借以提高查全率。因此,参照关系在一定程度上决定主题词表的功能。冠恩和达古里阿克调查《美国国会图书馆标题表》(L七)《医学索引标题表》(人悦SH)和《美国武装部队技术情报局主题词表》(ASTIA)之后发现,参照性愈强,检索效率愈高。反之,如果完全没有参照关系,或者参照关系不完备,检

文档评论(0)

f8r9t5c + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档