信息检索技术知识.pptx

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息检索技术知识.pptx

第二讲 信息检索技术课程主讲内容: ? 检索语言 ? 检索技术 ? 图书馆OPAC ? 中图法介绍信息检索基本原理 2.1 检索语言检索语言:是描述文献特征、用于标引和检索的人工语言。创建检索语言的目的,是建立沟通标引与检索的桥梁,也是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道。在存储的过程中用于标引信息称为标引语言;用于编制索引就称为索引语言;用于信息检索则称为检索语言。检索语言种类分类语言(classification language)是用分类号表达各种概念的检索标识,将各种概念按学科性质进行系统排列,反映科学知识分类体系的检索语言。主题语言(subject language)是直接以表达文献主题的语词作为检索标识,按字顺编排并通过参照系统等方法提示词间关系的检索语言。代码语言(code language)是对事物的某一方面特征用某种代码系统来加以标引和排列的检索语言。例如,根据化合物的分子式这种代码语言,可以构成分子式索引系统,允许用户从分子式出发,检索相应的化合物及其相关的文献信息。自然语言是直接从原始信息中抽取出来的未经规范化处理,用以揭示信息主题概念的检索语言。检索语言的类型描述内容特征语言描述外表特征语言主题语言分类语言代码语言责任者题名其他关键词语言——(keyword) 标题词语言——(heading) 单元词语言——(uniterm) 叙词语言——(descriptor)自然语言受控语言检索语言种类2.1.1 分类语言一种用分类号表达文献中的各种概念,并以学科性质为主对各种概念加以分类和系统排列的文献信息检索语言。通常以数字、字母或字母与数字相结合作为基本字符,采用字符直接连接并以圆点(或其他符号)作为分隔符的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念。优点:清楚反映类目之间的内在联系,包括从属、并列、交替、相关等。 将分类表中的全部类目列举出来,并按照特定的等级系统将信息组织起来的一 种分类方式。如:《中国图书馆分类法》 《杜威十进制图书分类法》(Dewey Decimal Classification,DC或DDC) 2.1.1 分类语言体系分类法 整个分类表全部由复分表组成,只给出一些基本概念(有关时代、地域、民族、语种、著作类型、体裁以及学科的总论性问题等具有共性的子目)的划分标准,不给出实际使用的概念子项。 组面分类法 2.1.1 分类语言《中图法》等级分明的科学系统    O …… 一级类目 数、理、化   O1 O3 O4 O6 O7 …… 二级类目  数学 力学  物理  化学  晶体  O11 O12  O13 …… 三级类目 古典数学  初等数学  高等数学  O121???? O122 O123 O124 …… 四级类目 算术?? 初等代数?? 初等几何?? 三角国内外常用的分类法有:国内:? (1).中国图书馆分类法? (2).人民大学图书馆图书分类法(人大法) 该分类法从1953起陆续在全国各图书馆试用,后经过多次修订再版,目前仍有许多图书馆采用该分类法。? (3).中国科学院图书馆图书分类法(科图 法) 该分类法主要用于中国科学院图书馆及其所属各科研单位的图书馆(室)。国外: (1).杜威十进制分类法(Decimal Classification)简称为杜威法,DDC 或DC 目前世界上使用最广泛、影响最大的图书分类法,已用于130多个国家的图书馆,许多分类法均是借鉴于杜威分类法产生的。 (2).美国国会图书馆图书分类法(Library of Congress classification)简称为LC。 (3).国际十进分类法(Universal Decimal Classification)简称UDC。 (4).国际专利分类法(International Patent Classification )简称 IPC。2.1.2 主题语言主题:一组具有共性事物的总称,用以表达文献所论述和研究的具体对象和问题,即文献的中心内容。主题词:表达主题概念的词汇主题语言:以主题词作为文献内容标识和检索依据的语言,以自然语言的字符为字符,用一组名词术语作为检索标识2.1.2 主题语言从形式上分 标题词正式主题词非正式主题词 单元词叙词按照选词方式的不同划分 按照选词方式的不同划分 关键词最早使用的主题语言之一,以规范化的自然语义作为标识来表示文献涉及的主题概念。其中表达主题的词语称为标题词从文献内容中抽选出来的最基本的词汇,将代表最一般、最基本的、不可再分割的概念的词作为单独标引文献的单位单元词是构成标题词的组件,绝大部分单元词都不是具体的标题。从自然语言中优选出来并经过规范化处理的名词术

文档评论(0)

yuzongxu123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档