- 1、本文档共46页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机信息检索原理讲述
计算机检索原理 与 检索方法 计算机检索原理 信息检索原理 信息检索实质上包括信息存贮和信息检索两 个过程: 信息存贮过程是依据检索语言对原始信息进行处理和标引,形成信息特征标识,为检索提供经过整序的信息集合的过程。 信息检索是参照检索语言体系对检索课题进行分析,形成检索提问标识,从信息集合中检出相关文献信息的过程。 信息检索原理 信息检索原理图 检索语言 概念 为了使检索的过程,即信息的标引标识和检索的提问用语的对比进行顺利,两者都需要用一定的语言来表达。这就是检索语言。 作用 把信息的存贮和检索联系起来,以保证检索和存贮的一致性,使文献的标引者和检索者取得共同理解,从而实现信息检索。 检索语言的种类--按描述文献特征的不同划分 1 描述文献外表特征的检索语言 如文章题名、作者姓名、语种、刊名等 2 描述文献内容特征的检索语言 包括分类语言和主题语言。 检索语言的种类-按加工程度划分 1 人工语言 主要有分类语言和主题语言 2 自然语言 如关键词 分类语言 类是许多具有共同属性事物的集合。 分类语言是以科学分类为基础,运用概念划分的方法,对人类知识进行区分与类集。 分类语言是用分类号来表达学科体系的各种概念,将各种概念按学科性质进行分类和系统排列。 如 “网络浏览器” TP393.092 常用的分类语言 《中国图书馆图书分类法》即中图法 是我国文献分类标引工作的国家标准 《中国科学院图书馆图书分类法》 即科图法 《国际十进分类法》 主题语言 主题语言是一种描述性语言,直接用语词表达文献的主题,这些语词就是表达主题概念的标识。将这些用作标识的语词按字顺排列并使用参照系统来间接表达各种概念之间的关系的检索语言就是主题语言。 信息检索的类型 信息检索的类型 —按检索对象分 ①数值检索 特征:以特定的数值为检索对象。 比如,查找某一统计数据,某一数学公式,某一材料的成分、性能,某种元件的型号、参数等。 解决方案:利用手册、年鉴等参考工具书或数值型数据库来检索。 ②事实检索 特征:以特定的事实为检索对象。 比如,查找名词术语的解释,了解某人或某机构的简况,或考证某一事件发生的前因后果等。 解决方案:利用辞典、百科全书、年鉴、名录等参考工具书或事实型数据库来检索。 ③文献检索 特征:以特定的文献为检索对象。 比如,查找有关某一研究课题的一定年限内的相关文献,或从事一项发明创造而需要文献查新等。 解决方案:利用文摘、题录等各种手检工具书或书目文献型数据库来检索。 信息检索的类型 —按检索手段分 手工检索 计算机检索 --光盘检索 --联机检索 --网络检索 计算机检索的条件 硬件 计算机及存贮、打印设备 软件 信息系统(数据库)及检索软件 通讯设备 网卡、网线等 信息使用权 大型商业数据库系统是有偿使用的,有些学术团体内部的信息资源仅限其认可的成员使用,需要签订协议获得使用权 数据库及其类型 数据库是在计算机存贮设备上按一定方式存储的相互关联的数据集合。是信息检索的重要资料来源。 按照载体的不同,可分为 --联机数据库 --光盘数据库 --网络数据库 数据库类型—按内容和功能划分 书目型数据库 以文档的形式组织起来,提供文献的题录、文摘等书目信息。 全文型数据库 存储文献全文或其中的主要部分的源数据库。 指南型数据库 供查询某一客体的基本信息或简况,包括名录、传记等数据库。 数值型数据库 提供各类数值型数据 图象数据库 以图形、图象为记录单位 数据库类型—按收录专业范围划分 综合性数据库 收录多个学科或专业的信息资料。如中国期刊网 专业性数据库 收录单一学科或专业的信息资料。 专题性数据库 收录某一特定专题的信息资料 数据库的结构—字段、记录和文档 字段:文献著录的基本单元,反映文献外部特征和内容特征的每一项目,在数据库中就称为字段。如:题名、作者。 基本字段:描述文献的内容特征。如:关键词KW、 题名TI、文摘AB、全文等 辅助字段:描述文献的外部特征。如:作者AU、刊名JN、出版时间PY、语种LA等 记录: 由若干不同字段组成的文献单元,一条记录在数据库中代表一篇文献。 数据库(文档): 由若干数量的记录构成的数据的集合。大型的数据库检索系统中称为文档。 计算机信息检索方法 检 索 流 程 1、分析课题的内容 ◆明确需要查找那一方面的文献; ◆对文献的类型、时
文档评论(0)