- 1、本文档共25页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 计算机信息检索基础知识2014
电子文献信息检索基础
什么是信息检索
信息检索是指用户根据自己的需要,借助于
检索工具,从信息集合中找出所需信息的过
程。
信息检索方法分为手工检索和计算机检索。
手工检索的对象是以纸张形式存储的信息
计算机检索的对象是以数据库形式存储的信息
机检和手检的比较
项目 手 检 机 检
总体特征 手翻、眼看、大脑判断 策略查寻、机器匹配
标引及检索 检索点较少 检索点较多
特点
检索时间 较慢 较快
检索要求 专业知识、外语知识、 专业知识、外语知识、
检索工具知识 机检系统知识
查询结果 查准率较高 查全率较高
综合效率 较低 较高
检索效果参数概念
查全率=输出的与检索课题相关的文献量*100%
系统中与课题相关的文献量
查准率=输出的与检索课题相关的文献量*100%
检索出的文献量
漏检率=100%-查全率
误检率=100%-查准率
最佳检索效果是漏检率和误检率均为零
计算机检索的优点
速度快:几分钟可从大量记录中找出所需信息
范围广:通过集成的统一平台和交叉链接,可迅
速浏览相关学科或主题的记录
数据新:网络数据更新快
功能全:检索界面友好,输出方式丰富、提供增
值服务(一次文献二次文献、原文引文)
使用方便:检索不受时空限制,只要具备相应的
网络条件,随时可以查询信息
计算机检索原理
用户提问 匹配运算 数据库
命中信息
电子文献检索流程示意图
电子信息源的基本结构树状图
记录和字段
作者字段
选择数据库
正确选择适用的数据库,往往会起到事半功
倍的效果
确定数据库的内容范围
• 数据库的学科范围
• 数据库的文献范围
• 数据库的语种范围
确定检索词
检索词——概括检索需求的简洁词语
• 确定检索词的2个要求
• 确定反映检索要求
• 符合数据库的输入要求
• 了解不同数据库对输入词语的不同要求
• 了解数据库可供检索的字段
• 了解数据库的用词特点
如:主题(DE)—检索词往往是规范化的词语,
即主题词
题目(TI)、文摘(AB)、关键词(ID)—检索词往往
是自由词,即对检索词没有任何特殊要求
检索效果 选词
主题词 较好 难
自由词 较差 容易
为了达到较好的检索效果,往往可采用多个字段同时
检索
编制检索式
截词检索
截词—用数据库所允许的符号来替代检索词的字符,
以保持检索词的词干部分,并允许有一定范围的字
符变化。
效果:很好解决检索词为词干相同,词义相近的词,
文档评论(0)