第五节课 第四章 计算机检索概论.ppt

  1. 1、本文档共65页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 计算机信息检索概论 上一章要点回顾 1.1信息检索的基本概念 1.2信息检索类型 1.3文献检索的原理 2.1检索语言的概念 2.2文献信息的内外部特征 2.3检索语言类型 其中包括《中图法》的结构体系为 3.1文献检索工具定义 3.2检索工具-类型 3.3检索途径(检索点) 4.1文献信息检索基本步骤 4.2查全率 4.3查准率 本章要点: 文献信息数据库原理:文档、记录、字段的定义及其关系; 计算机检索的步骤: 核心概念的分析方法; 检索概念的扩展方法(同物异名和上下位扩展法); 检索策略调整的基本方法。截词、逻辑算符、位置算符、字段限定和优先算符等) 4. 1 计算机信息检索概述 ★计算机信息检索的定义 —利用计算机查找文献信息的过程。 计算机检索发展简史 世界上第一个计算机检索系统是美国海军军械试验中心于1954年利用IBM-701型计算机建立的科技文献检索系统。随着计算机技术、通信技术和检索技术的不断发展,经历了四个发展阶段: 计算机检索发展简史 脱机检索(50年代中期到60年代中期) 联机检索国际联机检索(60年代中期到70年代中期) 光盘检索光盘网络检索(70年代中期到80年代末) Web信息资源检索(90初年代至今) 计算机检索发展简史 进入90年代,操作平台Windows化、数据库链接超文本化和通信手段互联网化已成为当前检索技术发展的主要特征。 计算机信息检索的特点 检索速度快 检索途径多 更新快 资源共享 检索更方便灵活 检索结果可以直接输出 计算机检索系统的构成 从物理构成来说,包括计算机硬件、软件和数据库、通讯线路和检索终端五部分 Questions 计算机检索与手工检索比较有什么优点? 4.2 文献信息数据库 数据库的定义和类型 数据库的构成 文献信息数据库的检索原理 文献信息数据库定义 ★数据库: 至少由一种文档组成,能满足特定目的的或特定功能数据处理系统需要的数据集合。 文献信息数据库类型 类型: 信息内容 文字型(大多数) 数值型 多媒体 加工深度 一次文献 全文型(中刊网、SDOS等) 二次文献 文摘型(Compendex等) 题录型 (SKBK等) 目录型 (OPAC、刊目录) 4.2 文献信息数据库 数据库的构成 由“文档—记录—字段”三个层次构成。 4.2 文献信息数据库 文档:是若干条逻辑记录构成的信息集合。文档是书目数据库和文献检索系统中数据组织的基本形式。 根据数据库的内部结构,一个数据库至少包括一个顺排文档和一个倒排文档。 顺排文档:是按照记录号顺序组成的数据集合,是数据库的主体、正文。由于它存贮有记录的最完整的信息,所以,通常又把它称之为主文档。无序性,无法检索。 倒排文档:按照一定的属性顺序,对顺排文档的内容,重新排列组成的数据集合,对数据库正文起索引作用。记录的特征标识(作者、期刊名称等)排序,其后列出含有此标识的记录号。提高检索效率。 数据库顺排文档与关键词倒排档比较示意图 4.2 文献信息数据库 记录—某一实体全部属性的描述, 是文档的基本单元。 字段—某一实体的具体属性的描述, 是记录的基本单元。 根据与文献内容相关与否,分基本字段和辅助字段两类: 基本字段(Basic Fields) (表达文献内容特征): 篇名字段、文摘字段、叙词字段、自由标引词字段 辅助字段(Additional Fields): (表达文献外表特征) 例:作者字段(AU=)、期刊名称字段(JN=)、出版年份字段(PY=)、语种字段(LA=)等。 在检索中,辅助索引一般不单独使用,而常与基本索引配合使用,起限定检索范围的作用。 4.2 文献信息数据库 机检原理: 输入检索提问标识 →倒排文档(与数据库标引标识进行比较匹配) →顺排文档 (根据记录号) →输出结果 。 (结果不理想时要进一步修改检索提问标识) Questions 1.至少由一种文

文档评论(0)

awang118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档