网站大量收购独家精品文档,联系QQ:2885784924

计算机信息检索ppt.ppt

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机信息检索ppt

逻辑与(and、*、空格等) solar and energy solar * energy 逻辑或(or、+、| ) solar or energy solar + energy 逻辑非(not、-、^、!) solar not energy solar - energy 例如: 1、“城市绿化” 检索式:城市绿化+(城市+北京+天津+上海+… )*(园林绿化+绿化建设+…) 2、“禾谷类作物病害防治,不是白粉病” (禾谷类作物+小麦+水稻+玉米+…)* 病害 -(白粉病) 3、土壤环境条件对豆科植物固氮作用的影响 关键词:土壤环境条件(温度、湿度,ph值) 豆科植物(大豆、花生等) 固氮作用(固氮菌、根瘤菌) 检索式:(土壤环境条件+温度+湿度+ph值)*(豆科植物+大豆+花生+…)*(固氮作用+固氮菌+根瘤菌) 2、截词(truncation)检索 截词——指检索者将检索词在他认为合适的地方截断。 截词检索(也称模糊检索或词干检索),是用截断的词的一个局部进行的检索,并认为凡是满足这个词局部中的所有字符(串)的文献,都为命中文献。 截词符号一般为“ ?”,也常用“$”,“*”。加在检索词的词干或不完整的词形后或中间,可以减少词的输入量。其基本含义是布尔逻辑OR的组配 截词方式: 根据截词的位置不同分为:前截断、后截断、中截断; 根据截断的数量不同分为:有限截断和无限截断。 后方截词:在一个词干后加一个“*”,表示可检出在该词后加任意个字符或不加字符的记录,如computer*,可检出computer,computers,computerisation等词。 前方截词:如 *computer,可检出computer,minicomputer,microcomputer等 前后截词 又称无限中截词,它是满足中间一致的检索。用截词符“*、?”加在词干的前后,表示检索词与被检索词之间只需中间匹配即可,如“*relation*”,可检索出“relation”,“relations”,“interrelation”等等。 A.无限截词*(或叫非限定性截词?) 有限后截词: smok???,其后最多有三个字符变化 可检出:smoke, smoky, smoker, smokers,smokes, smoking等 Smok??,最多有两个字符变化,可检出: smoker, smokes等. smok? ?,最多有一个字符变化 可检出:smoke, smoky等 B、有限截词(controlled Length truncation)(又叫限定性截词 ) 有限中截词(中间屏词) 如: wom?n 可检出: women woman 如: fib??board 可检出: fiberboard fibreboard 3、字段限定检索 将检索词限定在某一字段中,检索时,计算机只对限定字段进行运算。 A.主题字段:是内容特征的字段(有Title,Keywords,Subject,Summary等) B、非主题字段:是外部特征字段,如作者、文献类型、语种、出版年份等字段. 常用的检索符号有: in、=、、、≤、≥ 例1:English in la 例2: py≥1992 例3:查“玉米方面的英文”文献 检索式=(maize or zea-mays or corn)in de and(English in la) 4、全文检索 又叫位置检索position operators)、或邻接检索(proximity)限定两个关键词在文本中的距离, (1)记录级检索 C(cition)——两词必须同时出现在同一文献记录中,不限定词序和字段.如 Solar (C) energy (2)字段级检索 F(field)——两词必须同时出现在文献记录的同一个字段中,词序和词间插入词数不限,但需指明要查找的字段,如pollution (F) control/AB 文摘中含有如:control and management of industrial pollution ,等等均为命中文献 。 (3)子字段级检索 S(Subfield)——表示两词必须同时出现在同一个子字段中,即同一句子或短语中,词序和中间插入词数不限 。 Same(Sent)——两个词在同一个段落中。 (4)词位置检索 W(with)或 Pre——检索算符两侧的词必须相邻且词序不能颠倒。 如:(w)及(nW)——与(with) flue(w)cure

您可能关注的文档

文档评论(0)

sunshaoying + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档