- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(计算机基本方法与策略
计算机文献检索的基本方法与策略
计算机信息检索,实质上由计算机将输入的检索策略与系统中存贮的文献特征标识及其逻辑组配关系进行类比、匹配的过程。由于信息需求本身具有不确定性,加之对数据库中的文献特征标识不能充分了解,以及系统功能的某些限制,都会不同程度地影响检索效果。但是只要遵循一定的检索步骤,制定良好的检索策略,便可以减少各种不利因素的影响,尽可能地使检索提问标识与信息需求和检索系统保持良好的一致性,从而在系统中检索出满足用户需求的信。
1.检索步骤
(1)弄清信息需求,明确检索目的
信息需求是人们客观上或主观上对各种情报信息的一种需求。这种需求是人们索取情报信息的出发点,也是联机信息检索时选择数据库、确定检索策略以及评价检索效果的依据。不同类型的课题,其信息需求的范围和程度也不尽相同。例如,申请发明、申报成果奖励、鉴定及立项类的查新课题,往往需要全面地收集某一主题范围的文献信息,这类课题具有普查、追溯的特点,应着眼于查全;而对于科研、生产中为解决某一特定问题的攻关课题,往往只要求检出的信息对自己的研究有所帮助,而对查找的文献范围不需要很广。因此,这类课题则要求查准。
如何对信息需求进行正确的分析呢?不妨从信息需求的形式和内容两方面来分析。有关信息的形式需求要明确的问题有:
①明确检索目的。检索是为了申报成果,还是为了了解学科的必威体育精装版进展等等,据此以制定出符合查全或查准要求的检索策略。
②明确所需的文献量。规定所需文献数量的上限,对以后确定检索策略和控制检索费用是一个很重要的参数;同时还需对检索课题可能有的相关文献量做出估计。
③明确所需文献的语种、年代范围、类型、作者或其他外表特征,这对限定检索范围也很重要。
关于信息的内容需求要明确的主要问题有:
①明确检索课题内容涉及的主要学科范围,这对以后选择合适的数据库很重要。
②分析检索课题的主要内容,用自然语言来表达这些内容要求,这是联机检索中较为重要的环节。
(2)选择数据库,确定检索途径
分析了信息需求后,可根据已知的条件来选择合适的数据库,这一步隐含了检索系统的选择。如欲检索国外专利文献,则可以检索国内的BDSIRS系统的GWZL库。但其提供的检索途径及报道必威体育精装版专利文献方面不及美国的DIALOG系统的WPI库,当检索要求较高时,仍常选用美国的DIALOG系统。
选择数据库时,首先应了解:
①数据库收录的信息所涉及的学科领域;
②收录的文献类型,最好能进一步了解文献的主要来源;
③收录的时间范围;
④数据库的基本索引及辅助索引,它们提供的检索途径及检索标识的特点;
⑤数据库的检索费用,包括机时费和每篇记录的打印费。
数据库选定之后,其提供的检索途径也随之确定,并可根据已知的条件来确定某一个或几个检索途径。由于计算机存贮容量大和运算速度快,又对比较多的字段建立了索引,它不仅可以从手检中常用的主题词、分类号及作者等途径检索,而且可以从篇名、文摘的自由词、文献类型、期刊名称等途径进行检索,并且还能利用各种途径的组配进行交叉检索,这些都是手工检索所不及的。
(3)确定课题的概念组面和检索标识
弄清信息需求,了解了检索课题的主要内容后,确定其概念组面和检索标识是重要的一步。当检索课题包含较复杂的主题内容时,应明确组成课题内容的几个概念组面,并通过一定的逻辑组配形成一定的复合概念或概念关系来表达用户的信息需求。
确定了课题的概念组面,还须将概念组面转换成相应的为系统所识别的检索标识,检索标识的表示应符合两方面的要求,一是切题性,即检索标识反映信息需求;二是匹配性,即检索标识和检索系统的存贮特征标识相一致。
检索标识一般有如下三种形式:
①规范词: 从待检数据库的叙词表或主题词表中选取规范化的词或词组,因为词表是数据库标引和检索必须共同遵循使用的检索语言。为了使检索提问标识与文献特征标识相一致,获得最佳的检索效果,应优先选用规范词。
②规范化的代码: 索引代码是数据库系统为某些主题范畴或主题概念规定的索引单元。这类单元有很好的专指性,是一种有较好检索效果的文献特征标识。如国际专利分类号IC=,PTS数据库的产品代码PC=,标准工业代码SC=等等。
③自由词:使用自由词检索能够充分利用系统的全文查找功能。规范词或代码的选择需利用词表或分类表等进行自然语言到规范语言的转换,而标引人员和检索人员的思路不一致时也会影响检索效果。此时,用自由词在篇名、文摘甚至全文中查找显露出一定优越性,自由词直接、简明是科技人员易为接受、较为常用的一种方法。
④拟定检索提问式,确定具体的查找程序
检索提问式,是指计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其他组配连接符号组成。从某种意义上讲,检索式是检索策略的具体体现,它的质量好坏,将关
文档评论(0)