- 1、本文档共71页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息服务与用户 第六章 信息检索
第六章 信息检索 信息组织是指按照一定的规则来描述信息资源 或信息对象,以便于能被需要它们的人高效地利用。 信息检索则是指为了个人或他人的需要,去发现适当的信息资源或信息对象。 信息组织和信息检索是一对互逆过程。 6.1 信息检索的沿革与发展 6.1.1信息检索的涵义 根据特定的需求,运用某种检索工具, 按照一定的方法,从大量文献中查出所 需的资料或信息的过程。 满足信息用户的信息需求而建立的,存贮经过加工了的信息集合,拥有特定的存贮、检索与传送的技术装备,提供一定存贮与检索方法及检索服务功能的一种相对独立的服务实体(包括人和检索工作单位),统称为信息检索系统(Information Retrieval System,简称IRS)。 信息检索系统的三个基本要素:人、检索工具(包括设备)和信息资料 信息检索系统的体系结构 6.1.2 信息检索的类型与特性 手工检索工具主要指,如印刷版的《全国报刊索引》。 计算机检索系统 主要指,如《中国期刊全文数据库 》 数据信息和事实信息检索是确定性的检索,检索结果可以直接利用。 文献信息检索是一种相关性检索,检索结果是文献信息的线索,一般通过二次信息来实现。 全文数据库:是一次信息和二次信息的综合体。在检索结果中,有直接的全文链接。 特性: 信息检索的相关性 相关性表明用户是否认为一文献与一提问吻合。 信息检索的不确定性 标引的不确定性是指不同标引员在给同一篇信息对象进行标引时会选用不同的标引词,即标引词选用的不一致性。 信息检索的逻辑性 6.1.3 信息检索的发展历程 三个阶段 手工信息检索阶段 机械信息检索阶段 计算机信息检索阶段 手工信息检索阶段 信息检索起源于参考咨询工作,参考咨询工作产生的标志是1876年召开的美国图书馆协会第一届大会。1883年,波士顿公共图书馆首次设置了专职参考馆员和参考阅览室; 20世纪初,多数图书馆成立了参考咨询部门,主要利用图书馆的书目工具来帮助读者查找图书、期刊或现成答案。逐渐发展到从多种文献源中查找、分析、评价和重新组织信息;“索引”突破了以前的狭隘范畴,成为独立的检索工具; 40年代进一步包括回答事实性咨询,编制书目、文摘,进行专题文献检索,提供文献代译等。“信息检索”从此成为一项独立的用户服务工作,并逐渐从单纯的经验工作向专业化方向发展。 机械信息检索两种基本类型 机电信息检索系统 光电信息检索系统 机械信息检索并没有发展信息检索语言,只是采用单一的方法对固定的存贮形式进行检索,而且过分依赖于设备,检索复杂,成本较高,检索效率和质量都不理想。 计算机信息检索系统三个阶段: 1971年以前建立的信息检索系统,是传统的批处理检索方式。 1971年以后,产生并发展的联机信息检索系统,如OCLC、Dialog在线数据库联机检索系统。 20世纪90年代以来,产生并发展的网络信息检索阶段。 信息检索技术两个发展方向: 传统信息检索向全文文本、多媒体、多载体等新型信息检索的发展,在深度上提高管理和组织信息的能力; 信息资源的网络化和分布化,面向互联网中海量的信息资源,在广度上提高管理和组织的能力。 6.1.4信息检索的模型 布尔逻辑检索模型 (BooleanRetrieval Model,简称BRM) 概率检索模型(Probability Retrieval Model,简称PRM) 向量空间检索模型(Vector Retrieval Model,简称VRM) 模糊检索模型 (Fuzzy Retrieval Model,简称FRM) 是一种比较成熟、较为流行的检索技术,现代信息检索系统多采用这种技术。 逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符。 主要的运算符有逻辑“与”、“或”、“非”,分别用AND(*)、OR(+)、NOT(-)表示 布尔逻辑运算符执行的优先顺序为NOT、AND、OR 在一个检索式中,可以同时使用多个逻辑运算符,构成一个复合逻辑检索式。 布尔逻辑运算符含义 A AND(*) B表示文献中同时包含检索词A和检索词 B的文献才是命中文献 如:查找“胰岛素治疗糖尿病”的检索式为: insulin (胰岛素) AND diabetes(糖尿病)。 A OR(+) B表示包含检索词A的文献或者包含检索词 B的文献或者同时包含检索词A和B的文献为命中文献 如:查找“商务”的检索式为:commerce OR business A NOT(-) B表示包含检索词A同时不包含检索词B的文献为命中文献 如:查找“动物的乙肝病毒(不要人的)”的文献的检索式为:hepatitis B virus(乙
文档评论(0)