- 1、本文档共62页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机检索技术资料
计算机检索技术及中文数据库使用方法 一、计算机信息检索的基本技术: 布尔逻辑算符、截词算符、位置算符、字段限定检索等等。 在进行计算机检索时,有时有一些比较复杂的课题,如:“GPS在建筑中的应用”,既涉及GPS,又涉及建筑,还有“应用”,这时候就要编制出满足要求的计算机检索式,它是机检的基础。 一、计算机信息检索的基本技术 布尔逻辑算符、截词算符、位置算符、字段限定检索等等。 在进行计算机检索时,有时有一些比较复杂的课题,如:“GPS在建筑中的应用”,既涉及GPS,又涉及建筑,还有“应用”,这时候就要编制出满足要求的计算机检索式,它是机检的基础。 1布尔逻辑检索(Boolean Logic Retrieval) 逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符(Boolean Logic Operators),即与、或、非三种运算符号,用它们可以表示概念之间的逻辑关系。 2 位置算符(Proximity Operators) 位置算符是表示检索词之间位置关系的一种运算符。由于英文对一句话有多种表达方法,写法可能不同。如:“GPS在铁路桥研究中的应用”这个课题,用英文表达可能是“Using of GPS in Railway Bridge”, 也可能是“Using of GPS in Bridge of Railway”,因而可能编制出这样的检索式,GPS AND (Railway (2N)Bridge)我们可以通过位置检索提高检索的准确率 (1) (W)算符与(nW)算符 W 是word与 with的缩写。 特点:W词序不变,中间不可插词,但两词间可有一个标点,连字符或空格。 nW词序不变,中间可插入N 个词。 如:potential (w) energy可能检出potential energy and function 又如:gone (2w)wind 可能检出gone with the wind (2) (N)与(nN)算符 N是near的缩写 特点:N词序不限,中间不可插词,但两词间可有一个标点,连字符或空格。 nN词序不限,中间可插入N 个词。 如:econom?? (2N)recovery可能检出economic recovery,recovery of the economy, (3)同字段检索A(F)B,F是field的缩写。 特点:A、B两词必须出现在同一字段中,词序与词量不限。 如:environment (F)impact/DE,表示两个词必须同时出现在叙词字段内。 (4) 同句检索A(S)B,S是sentence的缩写。 特点:A、B出现在同一自然句中(子字段),其词序与词量不受限制。 如:electric (S)plant可检出electric power plants如:EI中的NEAR;PQDD中的W/n (两词间距小于n个单词,且前后位置任意),Pre/n (两词间距小于n个单词,且前后位置一定) 3截词算符(Truncating operators) 在英语词汇中,一个词可能有多种形态,如词的单、复数形式的不同,英美拼写方法不同、词性不同等。如果检索时将这类词全部输入进去,会增加检索时间和费用,采用截词法可解决这一问题。 所谓截词检索,是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中计算机会将所有含有相同部分标识的记录全部检索出来。常用“?”、“*”符号表示。 (1)有限截断。 是指在检索词后后截几个有限的字母,如名词的单复数,动词的词尾变化等。如输入computer? ?表示有0-1个字母变化,可检出computer和computers. 输入stud???表示截断处有0-3个字母变化,可检出study,studies,studied,studing. (2)无限截断: 在检索词后加一个“?“,表示该词后可加任意个字符。使用无限截词,所截词根不能太短,否则会输出许多无关文献,造成误检。 如:computer?可检出computers,computering,computered,computerization. (3)中间截断: 在检索词中间加一个或几个?号,主要解决一些英美拼写不同,单复数形式的不同的词的输入,可简化输入。如:输入wom?n可检出 woman,women 各种算符在数据库中的实际应用位置算符 1)EI NEAR Bridge NEA
文档评论(0)