[2013信息检索课件第2章.ppt

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[2013信息检索课件第2章

目录 2.1信息资源检索技术 2.2信息资源检索的方法、途径和步骤 2.3信息资源检索效果的评价 2.1信息资源检索技术 2.1.1 传统的信息资源检索技术 2.1.2 新型的网络资源检索技术 2.1.1 传统的信息资源检索技术 1 检索技术  检索技术是指应用于信息检索过程的原理、技术、方法、策略的总称,是检索系统为了提高检索效率,从概念相关性、位置相关性等方面对检索提问进行组配、加权、扩展、截词、邻近、限定的比较和运算处理技术。 2.1.1 传统的信息资源检索技术 2传统检索技术 (1)布尔检索 布尔检索(boolean retrieval)是用布尔逻辑算符将检索词、短语或代码进行逻辑组配的一种技术,也是目前最常用的一种检索技术。 2.1.1 传统的信息资源检索技术 逻辑“与” 2.1.1 传统的信息资源检索技术 逻辑“或” 2.1.1 传统的信息资源检索技术 逻辑“非” 2.1.1 传统的信息资源检索技术 布尔逻辑运算符优先级 布尔运算符优先级比较 有括号时:括号内的先执行; 无括号时:NOT AND OR 例:检索“唐宋诗歌”的有关信息。 关键词:唐、宋、诗歌; 检索表达式: (唐 OR 宋)AND 诗歌; 唐 AND 诗歌 OR 宋 AND 诗歌 2.1.1 传统的信息资源检索技术 (2)截词检索 截词检索(truncation retrieval)是指在检索词的适当位置截断,用截断的词的一个局部进行的检索。由于检索词与数据库所存储信息字符是部分一致性匹配,所以又称部分一致检索。 由于西文的构词特性:单复数形式不一致、英美拼写不一致 、词干+前缀、词干+后缀。 检索时,计算机会将所有含有相同部分标识的记录全部检索出来。在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。 2.1.1 传统的信息资源检索技术 2.1.1 传统的信息资源检索技术 (3)位置检索 位置检索,也称临近检索,主要是通过位置运算符来规定和限制检索词之间的相对位置或者检索词在记录中的特定位置来实施检索的技术。位置检索主要有以下几个级别。 2.1.1 传统的信息资源检索技术 (3)位置检索 (1)词位置检索 词位置检索主要是利用位置逻辑算符限定检索词之间的位置,来反映要检索的信息概念。常用的词位置算符有(W)与(nW)、(N)与(nN)以及(X)与(nX)3类。 ① (W)算符与(nW)算符 例如, “VISUAL(W)FOXPRO”可以检出“VISUALFOXPRO”或“VISUAL FOXPRO”; “control(1W)system”可以检出含有“control system”、“control of system”和“control in system”文献。 2.1.1 传统的信息资源检索技术 (3)位置检索 (1)词位置检索 ② (N)算符与(nN)算符 例如,“control(1N)system”不仅可以检出含有“control system”、“control of system”和“control in system”的文献,还可以检出含有“system of control”、“system without control”等的文献。 ③ (X)算符与(nX)算符 例如,“side(1X)side”可以检索到含有“side by side”的文献。 2.1.1 传统的信息资源检索技术 (3) 位置检索 (2)同句检索 同句检索要求参加检索运算的2个词必须在同一自然句或者全文数据库的一个段落中出现,检索词的先后顺序和插入词的个数不受限制。同句检索中用到的位置算符主要是(S),是“Sentence”或“subfield”的缩写。 例如,“electronic(S)optical”,可以检索到题名为“Cutting and Polishing Optical and Electronic Materials”的文献。 2.1.1 传统的信息资源检索技术 (3) 位置检索 (3)同字段检索 同字段检索是对同句检索条件的进一步放宽,表示在此运算符两侧的检索词必须同时出现在文献记录的同一字段内,其运算符有两种。 ① (F)算符 例如,“information(F)retrieval/DE,TI”表示“information”和“retrieval”两个词必须同时出现在叙词字段或篇名字段内。 ② (L)算符

文档评论(0)

wendan118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档