第四篇计算机信息检索技术.ppt

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 计算机信息检索技术 布尔逻辑检索技术 截词检索技术 限制检索技术 词位检索技术 1 .布尔逻辑检索技术 布尔逻辑检索是当今检索理论中最成熟的理论之一,也是构 造检索表达式最基本、最简单的匹配模式。布尔逻辑检索是通过 布尔逻辑算符来实现的,这些算符能把具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达 用户的检索需求。 布尔逻辑算符有三种:逻辑或(OR)、逻辑与 (AND) 和逻辑非(NOT),这三种算符表达不同的逻辑思想。 用布尔逻辑进行检索,就是用OR、 AND、 NOT三种逻辑算符在数据库中对相关文献的定性筛选,这是最基本、最常用的一种检索技术。 B 布尔逻辑检索技术 逻辑或(OR): 扩大检索范围,有利于提高查全率。 逻辑与(AND):缩小检索范围,有利于提高查准率。 逻辑非(NOT):缩小检索范围,有利于提高查准率。 布尔逻辑 算符的运算次序: (1)优先顺序: NOT 、 AND 、 OR (1)自然顺序 使用布尔逻辑算符注意的问题: (1)逻辑或 (1)逻辑非 A B A A B A+B A*B A?B 2 .截词检索技术 (1)截词方式:按截断的位置分为后截断、前截断、中截断;按截断的字符数量分为有限截断和无限截断。 (2 )截断符号:# (ORBIT )、$ (BRS )、 ?( DIALOG) 截词检索的逻辑含义: physic* physic + physical + physician + physicist + physics (3 )后截断:是前方一致的检索。 词的单复数 年代 作者 同根词 (4 )前截断:是后方一致的检索。 (5 )中截断:又称内嵌字符截断、屏蔽、通用字符法。 (6 )优点: 可以扩大检索 范围,提高查全率; 减少检索词的输入量,简化检索步骤。 3 .限制检索技术 在检索系统中,用来缩小或约束检索结果的方法,称之为限制检索。 限制检索方式: 利用前后缀符进行的字段检索 利用系统规定的限制符 限制检索命令进行的限制检索 3 .1 字段检索 字段检索:限定检索词在数据库记录中出现的字段范围的一种检索方式。 字段的类型 : 主题字段 又称基本检索字段,它表示文献的内容特征,用后缀符表示,例/TI、/DE、/ID、/AB; 非主题字段 又称辅助检索字段,表示文献的外部特征,用前缀符表示,例AU= 、CS=、LA=、JN=、PY=。 3 .2 使用限制符的限制检索 在一般联机检索系统中,还提供一类限制符,使用这类符号进行检索,可以从文献的外部特征限制检索结果,如命中文献的文种、文献类型、出版时间等。限制符的作用与前缀符一样,用法与后缀符相同。例chess/PAT。限制符可以与前后缀符同时使用。 3 .3 使用限制检索命令的限制检索 限制检索还可以利用各检索系统提供的限制检索命令进行。如DIALOG系统的 limit和limitall 两条检索命令。 4 .原文检索技术 原文检索技术是以原始记录中词与词之间的特定位置关系为检索对象的运算。 原文检索技术分三种情况: 词位检索 同句检索 同字段检索 4 .1 词位检索 词位检索又称邻接检索,词位检索常用的算符有: (W)、(nW)算符:利用(W)算符连接后的多元词成为一个固定词组, (W)算符的严密性较强。 (N)、(nN): (X)、(nX): 4。2 同句检索 同句检索要求参加检索运算的两个词必须在自然句中出现,其先后顺序不变。同句检索的位置算符为 (S)。 例: (BASIC OR COBOL OR PASCAL) (S) (PROGRAM* OR COMPIL*) 上述检索式等价于以下六个同句检索式: BASIC (S) PROGRAM* BASIC (S) COMPIL* COBOL (S) PROGRAM* COBOL (S) COMPIL* PASCAL(S) PROGRAM* PASCAL (S) COMPIL* 满足以上六种情况之一的,即为命中文献。 4。3 同字段检索 同字段检索算符 (F)、(L) 。 F是Field的缩写,它表示此算符两侧的检索词必须同时出现在数据库记录的同一字段中,次序可变,字段的类型可用后缀符限定。 L是Link 的缩写,它要求检索词同在叙词字段中出现,且具有词表规定的等级关系。所以该算符只适用于有正式词表,且词表中具有从属关系的数据库。 加权检索 加权检索是某些检索

文档评论(0)

xiaofei2001128 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档