第1章数字资源的检索原理与检索策略.ppt

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第1章数字资源的检索原理与检索策略

《数字资源检索教程》 讲授内容 第1章 数字资源的检索原理与检索策略 第2章 中文文献数据库 第3章 著名综合性参考数据库 第4章 英文参考数据库 第5章 全文数据库 第6章 电子图书、电子报纸及其使用 第7章 电子期刊及其使用 第8章 特种文献及其检索 第9章 事实和数值型数据库 第10章 网络学术资源的收集 第11章 信息资源的分析利用、组织与论文写作 第1章 数字资源的检索原理与检索策略 1.1.1 数字资源的概念与特点 文献的概念? 记录有知识的一切载体,统称为文献。 常见的纸质文献资源? 数字资源的概念? 数字资源是数字化的信息资源或数字化文献,是指可通过计算机本地或远程读取、使用,以数字形式存放在光、磁载体上,以电信号、光信号的形式传输的图像、文字、声音、视频等信息资源。 1.1.2 主要数字资源类型简介(五个类型) 1.1.3 数字资源检索的发展阶段(四个阶段) 脱机检索阶段 联机检索阶段 光盘检索阶段 网络检索阶段 1.1.4 数字资源检索的进展(三大技术) 全文检索技术 概念信息检索 超文本信息检索 基于内容的多媒体检索技术 图像检索 视频检索 音频检索 数据挖掘技术 1.2 数字资源检索原理 数字资源检索? 通过检索系统,采用一定的技术手段,根据一定的原则,在数据库或其他形式的数字资源中自动找出用户所需相关信息的过程。 检索原理? 本质:对信息集合和需求集合的匹配和选择。 1. 一方面,为保证用户全面、准确、快速地获得所需信息,要对原始信息进行存储,并以数据库或其他形式的资源存在。 2. 另一方面,对用户所表达的信息需求进行分析,并与所存储的数字资源进行匹配运算,自动检索出两者相一致的部分,输出给用户,即为检索结果。 1.2.1 信息存储 按照既定的标准和原则,从信息中选择合适的信息,并对这些信息的内容进行概念分析,用系统规定的检索语言进行标引,形成信息的特征信息,进行整理与排序,构成可供检索的数据库。 主要包括信息的采集、著录、标引和整序等过程。 1.信息的采集:常见的数据来源? 网络信息又是如何采集的? 2.信息的著录:文献特征(外表和内容特征)? 数据库的结构? 3.信息的标引:内容标识?自动标引?著录标引的作用? 4.信息的整序:数据评价与转换、数据录入、数据库的维护与更新。 1.2.2 信息检索 将描述特定用户所需信息的提问特征与信息存储的检索标识进行异同的比较,从中找出与提问特征一致或基本一致的信息。 1.识别用户:账号密码、IP地址允许机制 2.接收提问:三种界面形式 3.提问校验:语法检查、用词检查等 4.转化提问式:解释、转化 5.检索:匹配比较 6.结果输出:结果排序输出 1.3 数字资源的检索技术 1.3.1 布尔逻辑检索技术 检索词:是单字匹配?还是词组匹配?或者是句子匹配? 举例:《私营企业人力资源研究》如何检索? 布尔逻辑检索是指通过标准的布尔逻辑关系算符来表达检索词与检索词间的逻辑关系的检索方法 主要的布尔逻辑关系词有:逻辑与(AND)、逻辑或(OR)、逻辑非(NOT) 逻辑与 逻辑乘: “and”或“*”表示 组配方式:A*B或者A and B 表示两个概念的交叉和限定关系,只有同时含有这两个概念的记录才算命中信息 作用:增加限制条件,即增加检索的专指性,以缩小提问范围,减少文献输出量,提高查准率。 举例:私营企业 and(或用*) 人力资源 逻辑或 又称逻辑和:“or”、“+” 组配方式:A OR B或者A+B,表示检索含有A词,或含有B词,或同时包含A、B两词的文章。 作用:放宽提问范围,增加检索结果,起扩检作用,提高查全率。 举例:(私营企业 or 私人企业 or 民营企业 or 私企) and 人力资源 逻辑非 又称逻辑差: “not” “-” 组配方式:A-B,表示检索出含有A词而不含有B 词的文章。 作用:逻辑非用于排除不希望出现的检索词,它和“*”的作用相似,能够缩小命中文献范围,增强检索的准确性。 举例:人力资源 not 国营企业 例如检索:“打印机驱动程序” 查询关键词:打印机、驱动程序 检索表达式:打印机*驱动程序 例如检索:“微型计算机”方面的有关信息 查询关键词:微型计算机、微机 检索表达式:微型计算机+微机 例:检索“唐宋诗歌”的有关信息 关键词:唐、宋、诗歌; 检索表达式: (唐 + 宋)*诗歌; 唐 * 诗歌 + 宋 * 诗歌; 错误表达式: 唐 + 宋 * 诗歌; 唐 * 宋 * 诗歌

文档评论(0)

zhuliyan1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档