- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章 计算机检索概述 第5章 计算机检索概述 第5章 计算机检索概述 5.1.1 计算机信息检索的含义 计算机信息检索指人们根据特定的信息需求,按照一定的方法,利用计算机从相关的信息检索系统中识别并获取所需的信息。计算机信息检索的过程包括信息存储过程和信息检索过程,其本质是信息用户的提问标识和信息集合数据库特征标识匹配的过程。 第5章 计算机检索概述 第5章 计算机检索概述 5.1.2 计算机信息检索发展简史 计算机信息检索的发展经历了四个阶段: 第5章 计算机检索概述 5.1.3 计算机信息检索的分类 计算机信息检索包括许多类型,依据不同的划分标准,可以分为不同的类型: 1. 根据所检索数据库的形式分 第5章 计算机检索概述 2. 根据计算机检索服务方式分 第5章 计算机检索概述 5.1.4 计算机信息检索的特点 1. 检索范围大。 2. 检索速度快。 3. 检索功能强,组配灵活。 4. 检索途径多。 5. 数据更新及时,时效性强。 第5章 计算机检索概述 6.2.1 检索策略的含义和作用 所谓检索策略,即在分析检索课题内容实质基础上,选择检索系统、检索途径、确定检索词及其相互间的逻辑关系等的信息检索方案。信息检索策略的实质是对检索过程的科学规划。其中关键在于构造能够确切表达信息需求的检索式。 第5章 计算机检索概述 5.2.2 检索表达式 检索表达式是检索策略的具体体现,简称检索式。检索式一般由检索词和各种逻辑运算符组成,具体来说,它将检索词之间的逻辑关系、位置关系等用检索系统规定的各种算符连接起来,成为计算机可以识别和执行的命令形式。检索式构造的优劣关系到检索策略的成败。 检索表达式主要有逻辑表达式、加权表达式和其他表达式。其中,最为常用的是逻辑表达式。 第5章 计算机检索概述 5.2.2.1 逻辑表达式 逻辑表达式是指利用布尔算符,对检索词的关系进行表达,又称布尔逻辑表达式。 有逻辑与“AND”、逻辑或“OR”、逻辑非“NOT”。 第5章 计算机检索概述 5.2.2.2 位置检索表达式 位置检索表达式,也称邻近检索。通过位置算符来表示两个检索词(或短语)之间的距离和位置关系。不同的检索系统可能会采用不同的位置算符,目前应用广泛的主要是: 第5章 计算机检索概述 5.2.2.3 截词检索表达式 截词检索表达式指在检索式中用专门截词符号表示检索词的某一部分允许有一定的词汇变化 。 截词检索表达式在西方语言检索中应用比较广泛,在中文信息检索中也有一定的应用。 不同检索系统采用的截词符不完全相同,一般常采用“?”、“*”等。 第5章 计算机检索概述 后截词,又称右截词、前方一致,允许检索词尾部有若干变化形式。例如,检索式comput ?将检出包含computer、computing、computerized、computerization等词汇的结果。 中间截词,允许检索词中间有若干变化形式,例如wom*n就可同时检索到含有woman和women的结果。 前截词,又称左截词、后方一致,允许检索词的前端有若干变化形式,例如检索*physics就可检得包含physics、astrophysics、biophysics、chemophysics、geophysics等词的结果。 第5章 计算机检索概述 5.2.2.4 限制检索表达式 限制检索表达式指用限制符限定检索词出现范围的检索式。 常用的字段限定代码有:标题(TI,Title)、作者(AU,Author)、主题词(SU,Subject)、年代(PY,Publication Year)等。 一些网络检索工具也允许用户采用限制检索表达式,可把检索范围限制在标题、统一资源定位地址(URL)或超链等部分。 第5章 计算机检索概述 5.2.3 检索策略的构造步骤 信息检索策略的构造步骤如图: 第5章 计算机检索概述 5.2.4 检索策略的反馈与调节 5.2.4.1 影响查全率和查准率的主要因素 1.主题分析是否准确、全面 2.检索词选择是否准确 3.检索词之间逻辑关系的配置是否合适 第5章 计算机检索概述 5.2.4.2 提高查全率和查准率的方法 1.提高查全率的方法 第5章 计算机检索概述 2.提高查准率的方法 第5章 计算机检索概述 5.3.1 全文检索技术 全文检索(Full Text Retrieval),就是以各类数据诸如文字、声音、图像等为主要处理对象,根据数据资料的内容,而不是外在特征来实现的信息检索技术。 与其
文档评论(0)