- 1、本文档共71页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.概论2【荐】.ppt
第三节 信息检索※ 一、信息检索的概念 广义:将信息按一定的方式组织和存储起来,并根据用户的需要找到有关信息的过程和技术。 狭义:从信息集合中找到所需信息的过程。 二、信息检索的类型※ 按检索对象划分 文献检索(Document Retrieval) 是信息检索的重要部分 数据检索(Data Retrieval) 事实检索(Fact Retrieval) 图像检索 多媒体检索 按检索方式划分 手工检索 计算机检索 (一) 信息检索语言 概念※ 实质上是一种检索标识系统,在信息检索中用来描述信息特征和表达检索提问的一种专门的人工语言。 作用:是沟通信息存储与信息检索两个过程的桥梁。 检索语言的种类※ 1.按其规范化程度不同: 非规范化检索语言——自然语言 规范化检索语言——人工语言 (关键词) 如: 艾滋病 爱滋病 AIDS 获得性免疫缺陷综合征 获得性免疫缺陷综合征 (主题词) 2.按描述的文献特征划分: 标题词语言 是主题法系统中最早出现的一种,是以标题词(规范的事物名称、名词术语)作为文献主题内容的标识和检索标识。其主要特征是事先编表,标题词以固定的组合方式组织在主题表中,形成标题,检索按既定组配执行。标题表通常由一个主表和若干个辅助表组成。《美国国会图书馆标题表》(LCSH)是当今最著名的标题表。 标题法比较直观、容易掌握,查找速度快,但查全一门学科或具某一属性事物的文献却比较困难。 3. 按结构原理划分: ※ (1)分类检索语言 (2)主题检索语言 (3)代码检索语言 (1)分类检索语言 用分类号表达各种概念,将各概念以学科性质为主加以划分和系统排列的检索语言。 分类检索语言可以鸟瞰全貌、触类旁通,系统地掌握和利用一个学科或专业范围的信息。 体现了学科的系统性。 国际十进分类法(UDC) UDC已有23种语言的版本。 UDC的类目表主要由主表与辅助符号、辅助表组成。UDC的主表把全部知识分为十大门类,每一类下分大纲、目、分目。UDC基本分类如 主题词(叙词)※ 叙词 ( discriptor )又称主题词( subject headings ),是能够表达文献主题内容的规范语言。 其主要特点是采用的词语有较严格的限定。对一个概念的同义词、近义词及拼法变异词等进行“规范”,以保证词语与概念的一一对应,是典型的规范化语言。 如:医学主题词表(叙词表)以后单独介绍。 关键词※ 关键词(keyword)是指出现在文献中的,能表达文献主题内容的,或被人们用作检索入口的关键性专业名词术语,不作规范化处理,没有特别的限定。 直接取自必威体育精装版文献,即时反应科学领域的新观点、新方法、新发现以及新的名词术语。 容易造成漏检。 主题词和关键词的异同※ 主题词: 规范化检索语言 表达文献的主要内容 只用一个概念表达同一主题的文献,文献相对集中 各个主题词之间有参照系统和等级关系相互关联,从而文献之间也互相关联 一些新出现的名词术语不能在主题词表中及时出现。 关键词: 非规范化检索语言 表达文献的主要内容 新兴名词术语及时编制成索引 简单易于掌握 同一主题的文献分散,需要提供所有的同义词和近义词 不能显示出各个关键词之间的关联 例: 关键词(自由词):carcinoma, tumor, cancer 主题词(数据库标引用词):neoplasms 关键词:先天性心脏病,先天性心脏缺损,心脏畸形,先天性心脏异常,异位心等 主题词:先天性心脏病 检索结果的比较 主题检索语言和分类检索语言的比较 分类检索语言与分类检索语言从不同的角度揭示文献内容。 分类检索语言主要揭示文献中所论述的问题,它从文献的内容出发,将研究对象置于一定的学科体系之下。各个类目相互关联、层层展开。下位类的意义必须借助于上位类才能明确;上位类的意义必须通过下位类才能体现。所以检索时一定要关注其上下位类,帮助选择。 优点:具有严格的学科分类秩序,隶属、平行、派生关系明确。 可以很好的系统检索、浏览检索功能,便于鸟瞰全局、触类旁通。 缺点:分类法的体系庞大复杂,不容易掌握,对细小专题也难于揭示和检索。 主题检索语言直接用名词术语作为检索词,表达概念较为准确和灵活,直接性、专指性易用性是主题法的主要特征。 主题法只注意揭示文献中所论述与研究的对象,各个主题词之间是相互独立的。虽然主题词表中也有主题词隶属关系的表现(范畴表),但仍然侧重的是从某一个知识点揭示文献。 所以,分类和主题检索语言互相补充,在实际检索中要相互结合,保证查全和查准。 (二)信息检
文档评论(0)