- 1、本文档共51页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
文献检索第二讲课件.ppt
第二章 情报检索的原理与技术 中国药科大学图书馆 2010年9月 第一节 情报检索原理 一.情报检索概念 二. 情报检索类型 三.情报检索语言 四.情报检索工具 一.情报检索概念 二. 情报检索类型 三.情报检索语言 四.情报检索工具 第二节 情报检索技术 一. 传统检索技术 二. 现代检索技术 三. 检索策略 一.传统检索技术 1. 布尔逻辑检索(Boolean Logic Retrieval) 通过对一些简单概念检索词的组配,表达一个复杂概念。表达概念间的并列关系、相交关系和排斥关系,分别是逻辑或(or)、逻辑与(and)、逻辑非(not)。 (1)逻辑“或” “or”或“+” (2)逻辑“与” “and”、“*”或“×” “与”用于概念交叉和限定关系的组配。可以缩小检索范围,减少命中文献量,提高查准率。 检索式写作 A and B 、 A * B 或A ×B 表达意义 数据库中同时有检索词A和B的记录才为命中记录。 (3)逻辑“非” “not”或“—” 注意: 布尔逻辑检索算式优先执行顺序通常是NOT、AND、OR,在有括号的情况下,先执行括号内的运算,在多层括号时,先执行最内层括号的运算。 布尔逻辑检索比较容易掌握,但使用不当会造成大量误检和漏检,尤其是非运算符的运用应特别小心。 2. 位置算符检索 位置检索也叫邻近检索,是用一些特定的算符(位置算符)来表达检索词与检索词之间的邻近关系,并且可以不依赖主题词表而直接使用自由词进行检索的技术方法。 位置关系包括词距(单词间的间隔)和词序(单词的先后顺序)两个方面。 (2)(N) (N)算符是Near的缩写,表示算符两侧的词必须紧密相连,中间不得有其他字符,但词序可以颠倒。 (nN) nNear n是一数字,表示在两个检索词之间最多可以插入n个单词,且词序可以颠倒。 (3)(F)——Field同字段检索,检索词必须同时出现在同一字段中。 (4)(S)——Subfield或sentence ,同子字段或同句检索,参加检索的两个词必须出现在同一个自然句中。 3. 截词检索 由于西文的构词特性,在检索中经常会遇到名词的单复数形式不一致;同一意义的词,英、美拼法不一致;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等。 截词是在检索词的某个局部截断,采用截词符构成模糊检索,防止漏检。 截词符(通配符) ? ?? ??? * 意义 截词检索具有逻辑or 的运算特性。 4. 字段限制检索 字段限制检索是限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索。 在检索系统中,数据库设置的可供检索的字段通常有两种:表达文献主题内容特征的基本索引字段和表达文献外部特征的辅助索引字段。基本索引字段包括篇名、文摘、叙词、自由标引词四个字段;辅助索引字段包括除基本索引字段外的所有字段,如著者字段、著者机构字段、文献类型字段、语种字段等。 基本索引字段一般用后缀表示,如 medicine/TI,或medicine In TI ;辅助索引字段一般用前缀表示,如AU=Smith D. ,再如PY=2005。 5.词组检索 6.加权检索 二. 现代检索技术 三. 检索策略 ⑴检索结果情报量过多 原因有二:一是主题词本身的多义性导致误检;二是对所选的检索词的截词截得太短。 调整的方法:减少同义词与同族相关词;增加限制概念,采用逻辑“与”连接检索词;使用字段限定,将检索词限定在某个或某些字段范围;使用逻辑“非”算符,排除无关概念;调整位置算符,由松变严。 ⑵检索结果情报量过少 原因:选用了不规范的主题词或某些产品的俗称,商品名称作为检索词;同义词、近义词没有用全;上位概念或者下位概念没有完整运用。 调整的方法:选全同义词与相关词并用逻辑“或”将它们连接起来;减少逻辑“与”的运算,丢掉一些次要的或者太专指的概念;去掉某些字段限制;调整位置算符,由严变松。 (1)按照截词的位置 后截断:将截词符号放在一个字符串的右方,满足截词符左方所有字符的记录均为命中记录。 性质上讲,是一种前方一致的检索。 例如 market* (market or marketabl
文档评论(0)