- 1、本文档共78页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4课 计算机及网络检索概论;4.1.1 计算机在检索中的利用;4.1.1 计算机在检索中的利用;1.??国外)早期应用情况:
1951年人们首次利用计算机进行信息检索实验。
自1954年美国海军兵器中心使用IBM701型电子管计算机建立了世界上第一个计算机检索系统,存入文献14000篇。
1964年,在使用计算机排版《IM》时产生一副产品:MEDLARS数据库(医学文献分析与检索系统)。
相应发展出4种机检类型:
脱机检索阶段(20世纪50年代中至 60年代中)
联机检索阶段(20世纪60年代中至70年代)
光盘检索阶段(20世纪80年代中期- )
网络化联机检索阶段(20世纪90年代- );;4.1.2 计算机信息检索及类型;二. 计算机信息检索原理;三. 计算机信息检索服务种类:;4.2 数据库的类型与结构;1、文献型数据库:
书目型数据库:文献外表特征和内容特征的描述与记载。
全文数据库:存储文献全文或节选其中主要部分的数据库。可以直接获取原始资料。
2、数值型数据库:
3、事实型数据库:
4、图像型数据库:
5、多媒体型数据库:;不同的数据库,虽然利用原理相同,但由于数据内容和利用目的的不同,使得其数据结构和文献记录标引方式也有一定的差异,因而在利用也会各有特点,并不存在普遍适用的方法。
利用一个数据库,首先要了解其结构。
数据库可分为字段、记录、文档3个层次的构成。; ;文章号;常用的外文生物医学数据库:
MEDLINE数据库
荷兰《医学文摘》数据库(EM)
《生物学文摘》数据库(BA)
化学文摘数据库(CA)
《科学引文索引》数据库(SCI)
常见的中文生物医学数据库:
中国生物医学文献数据库(CBMdisc)
中文生物医学期刊数据库(CMCC)
中国学术期刊数据库
万方数据库
中医药文献数据库
;4.3 计算机信息检索技术与方法;4.3.1布尔逻辑运算符:;布尔逻辑算符;布尔逻辑算符;布尔逻辑算符;4、运算次序与注意事项;检索实例:;4.3.2字段限定符;也称通配符,通常用“*”代表无限多的字符组合,而用“?”代表任意一个字符。
截词检索:是用截断的词的一个局部进行检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中文献。
实质是用逻辑OR对具有相同的词头或词尾的词汇进行检索。
;(一) 后截断:
将截词符号放在一个字符串的右方,以表示其右的有限或无限个字符不影响该字符串的检索。
后截断检索技术最常用,其主要用途有:
词的单复数,如book?
同根词,例如biolog*, physic*
年代,例如199?,19??
作者,例如:Lancaster*
例如:
hyperthyr*可查到hyperthyre、hyperthyreosis、hyperthyroid、hyperthyroidosis、hyperthyroidism等。
hypertensi??可查到hypertension、hypertensive。
; (二)前截断:
将截词符号放在一个字符串的左方,以表示其左方有有限或无限个字符。
前截断因为实现技术上较困难,在检索系统中比较少见。其主要用途在于:进行一个学科的不同应用领域的检索,常用于检索化学化工文献与复合词较多的文献。如:
例1:*magnetic , 可检索出magnetic(有磁性的)、electro-magnetic(电磁的)、 patamagnetic (顺磁的)、thermo-magnetic (热磁的)thermomagnetic等词的文献。
例2: *sighted,可查到farsighted 与nearsighted。
; (三)中截断:
将截词符号放在一个检索词的中间的一种截词方式。只允许有限截断,用于检索词的单复数或英美式不同拚法。例如:
wom?n,可查到Woman,Women。
defen?e ,可查到defense,defence。
;;4.3.4位置算符
又称邻近检索,是用来规定概念相互间的邻近关系,包括在记录中出现的顺序和相对位置。运算符都用“( )”括起,前后不留空格。
要求原始记录中检索词之间的相互位置满足某些条件时要使用位置算符,常用的位置算符有with、near等。
;;(2)near算符(N)与(nN)
A near B表示命中记录中左右两个检索词出现在同一句子中。
A (nN) B 的检索结果是A与B必须同时出现在一句话中,无论语序,二者之间最多可相隔n-1个单词。N的取值范围一般在1-25。
如智能机器人(3n)控制,可检出“智能机器人控制”,“..控制算法对智能机器人的影响” 、“智能机器人行为控制”等;4.3.5其他检索技术;;4.4.1 Internet的历史与发展
一
文档评论(0)