- 1、本文档共54页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2 计算机文献检索 主要内容 2.1 计算机检索概述 2.2 标引、分类表、主题表 2.3 数据库 2.4 检索技术 2.5 检索途径和检索程序 2.6 书目及多馆联合目录 2.1 计算机检索基本原理 2.1.1计算机信息检索的简短回顾 计算机信息检索,是指利用计算机进行信息存贮和检索的过程。 脱机检索系统,指利用单台计算机的输入输出装置进行检索的系统。由计算机硬件、检索软件和数据库三部分构成。 联机检索系统,是一台主机带多个终端的计算机信息检索系统。具有分时操作能力,能使许多相互独立的终端同时进行检索。联机检索系统包括检索系统主机、通讯网、检索软件、检索终端和数据库。 计算机信息检索始于上世纪60年代初,它的发展可分为4个时期: 第一阶段(1954-1964):脱机检索阶段 第二阶段(1965-1972):联机检索阶段 第三阶段(1972-1992):国际联机检索阶段 第四阶段(1993- ):网络信息检索阶段 我国计算机文献检索的发展始于1975年,大体经历了3个发展阶段。 第一阶段是萌芽阶段(1975-1980),其特点是引进与试验。 第二阶段是生长阶段,以服务和自己研制为特点,时间大约从1980年到1990年。 第三阶段是迅速发展阶段(1990-),其特点是普及与完善。 2.1.2计算机文献检索的意义 第一,计算机检索极大地提高了文献信息的使用价值。 第二,计算机检索促进了国际文化技术的交流和全球的文献资源共享。 第三,促进了计算机科学和情报学的发展,提高了文献服务机构在信息社会中的地位。 2.1.3计算机文献检索的特点 检索速度快 检索途径多 计算机检索系统对数据库记录的很多字段都做了索引,均可作为检索入口。 使用方便 计算机采用灵活的逻辑运算和后组式组配方式,便于进行多员检索和多途径检索。 检索范围广 计算机能提供远程检索。联机联网系统中含有大量的数据库,其主题涉及各个学科领域。 检索内容新 、时效性强 2.1.4计算机文献检索的基本模式 这个过程可简单地描述为:从文献选择需要录入数据库的文献;对这些文献进行概念分析,把它们的外部特征以及内容特征提取出来,按一定格式制成数据库;然后收集用户的提问,对这些提问进行概念分析,把它们的提问要素(篇名、作者、分类号、主题词等)提取出来,按一定要求列成提问式;检索时将数据库中的文献的特征与提问中的特征进行比较,符合提问式要求的文献即为命中文献,予以输出。 2.2 标引、分类表、主题词表 2.2.1 标引 标引:将信息和提问的内容特征用情报检索语言的形式表达出来的过程,当使用分类号来表达信息内容时就叫做分类标引,当使用主题词来表达文献内容时就叫做主题标引。 2.2.2 分类表、主题表 分类表又称类目表,具有以下四种属性: ○ 网罗性。 ○ 体系性。 ○ 明确性。 ○ 可查性。 主题词表是对检索和标引用词进行规范并显示其中各种关系的词表 。其作用: ○ 通过同义词的互见对检索和标引用词进行规范,将不同形式的同义词转换成事先选择好了的唯一形式,从而避免由于对同义词的不同选择而造成的漏检。 ○ 通过上位词、下位词的显示来增加机器的扩检缩检功能。 ○ 通过内容互有关联的主题词的“参见”提高检全率。 2.2.3 文献标引的方法 分类标引,是在分类表中找一个或几个与文献内容相符的类目,将这个类目的类号作为这篇文献的分类号。 主题标引: 用主题词(subject term)标引,即选用主题词表中的词对文献进行标引。 用自由词(free term)标引,既当文献的主题在主题词表中找不到合适的词来表达,直接用词表以外的词进行标引。 进行主题标引时,遵循的两个基本原则: ○ 标引用词要准确反映文献的内容,即尽量用能准确反映文献主题的词来标引。 尽量在主题词表中找到切题的词,当在表中找不到合适的主题词时,先用主题词表中的词把所要标引的概念组配出来,然后用自由词标引。 对于主题词表中没有收录,又无法用其它主题词组配出来的主题概念,可用它的上位主题词或近义主题词标引,同时把该概念的自由词形式标上。 ○ 标引时尽量选用用户最容易使用的词标引,尤其是自由词标引时,不用生僻词。 2.3 数据库 2.3.1 数据库的类型 数据库:指包含书目及文献有关数据的机读记录的有组织的集合。是计算机信息检索系统的信息源和核心。 记录包括两个方面:一是原文标题、内容及作者的信息,二
文档评论(0)