信息检索原与技术.ppt

  1. 1、本文档共90页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 信息检索原理与技术 第一节 信息检索基本原理 第一节 信息检索基本原理 第一节 信息检索基本原理 信息检索的过程往往需要一个评价反馈途径,多次比较匹配,以获得最终的检索结果。其图示如下: 第一节 信息检索基本原理 1)分类检索(classification) 2)主题检索 3)作者检索 4)名称检索 5)号码检索 其他检索点 EI的检索实例 1.5 信息检索的类型 信息检索的类型 计算机检索的优势 信息检索的类型 当前许多经典的印刷型工具都有其对应的电子数据格式、数据库,印刷工具则成了电子数据加工输出的副产品,许多新生的数据库不再与印刷型工具有缘,仅有其电子版本。 第二节 信息检索数据库(工具) 检索工具(数据库)的功能 检索工具(数据库)的分类 检索工具(数据库)的构成 1、检索工具(数据库)的功能 1)事实检索 2)目录检索: 3)文摘索引检索 2、检索工具(数据库)的分类 国际上通常根据数据库内容将数据库划分为三大类: (1)参考数据库(Reference Database) (2)源数据库(Source Database, 在欧洲也称数据银行:Data Bank) (3)混合数据库(Mixed Database) 另一种划分数据库的实用方法是分为文献数据库与非文献数据库两大类,前者以书目数据库和全文数据库为主,后者以数值数据库和术语数据库为多。 3、检索工具(数据库)的构成 数据库 文档 若干个记录构成的信息集合称为文档。大型的数据库分割成若干文档。 记录 记录是构成数据库的完整的信息单元,每条记录描述了原始信息的外部特征和内部特征。 字段 组成记录的数据项目。 数据库与检索系统 数据库与检索系统是两个不同的概念。 数据库是信息的集体体,是一种信息管理的方式。 检索系统是个软件。检索系统主要用于检索数据库。 一个检索系统可以容纳上百个数据库,可同时对上百个数据库进行检索。 一个数据库可依存于不同的检索系统。 第三节 计算机信息检索技术 计算机信息检索的定义 信息资源的计算机检索实质是利用计算机与远程通信技术来实现信息的采集、处理、存储、检索和传递等过程。这些信息包括声音、图像、文字和数据等一切内容。 第三节 计算机信息检索技术 计算机检索的历史和现状 ??? 起源于20世纪50年代的美国,主要经历了以下四个阶段: 1)脱机(单机)检索 2)联机检索 3)网络检索? 4)智能信息检索(未来) 计算机检索的历史和现状 脱机检索是用户与机器脱钩,不直接参与检索,不介入与机器的对话,检索以批处理(batch processing)的方式进行,如定题检索服务(SDI)。 SDI检索服务:把一批事先制定好的检索式存放在机器中,在收到必威体育精装版文献后执行检索,并将检索结果定期送到用户手中,可长期跟踪某专题的研究。 联机检索指用户利用计算机终端设备,通过通讯线路,从信息中心的计算机(主机)数据库中检索出所需要的信息的过程,它是一种实时的在线检索,知名检索系统如Dialog、STN系统等。该检索检索范围广、检索速度快、检索功能强,但检索费用昂贵,检索命令和方法较复杂。 计算机检索的历史和现状 网络检索可同时使用网上多个主机,甚至所有主机的某种资源而并不需要用户预先知道它们的具体地址。这就极大扩宽了其检索的空间和信息量,包括世界各地的各种文献信息资源及其指向的网络页面。但互联网信息庞杂,正式与非正式信息及其交流渠道共存,信息缺乏有效的组织管理,因此检索效果很难用一般意义上的查全、查准这些概念来衡量。 在前三个发展阶段的基础上,随着自然语言处理和信息组织技术的不断发展,计算机信息检索系统跨入一个新的阶段——智能信息检索。 第三节 计算机信息检索技术 初级检索技术 A. 逻辑运算 B. 截词检索 C. 位置检索 D. 检索字段控制 A. 逻辑运算(布尔算符) 用来表示两个检索词之间的逻辑关系 常用的有三种;逻辑与(and) 、逻辑或(or)和逻辑非(not) 这里用A和B分别代表两个检索词,它们的逻辑关系由下表和图说明。 A. 逻辑运算(布尔算符) 逻辑运算符的优先等级 NOT >AND >OR 改变优先等级 ( ) 将检索表达式的某一部分用括号括起来,表示命令计算机首先运算()中的提问式,而不是按照计算机系统默认的运算符优先级别进行运算。 查询:2010 AND 世界杯 AND NOT 小组赛 课堂练习 q = 病毒 AND (计算机 OR 电脑)AND NOT医 d1: …据报道,计算机病毒近日猖獗… d2: …小王虽然是学医的,但对研究电脑病毒也很感兴趣,最近发明了一种… d3: …计算机程序发现了爱滋病

文档评论(0)

wst34008 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档