信息检索语言精选.ppt

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息检索语言精选

自然语言(natural language)检索用词是从信息内容本身抽取的,主要依赖于计算机自动抽词技术完成,辅以人工自由标引(非依据词表的标引方法),是非规范词(uncontrolled term)。 自然语言的标识包括: (1)关键词(keyword):直接从信息资源名称、正文或文摘中抽出的代表信息主要内容的重要语词。这部分有时由人工自由标引进行,如期刊论文中的作者关键词,大部分由计算机标引系统自动完成。 (2)题名:信息资源的名称,如论文篇名、图书书名、网站名称等。 (3)全文:从资源的全部内容中自动抽取、查找,是目前网上各类有哪些信誉好的足球投注网站引擎使用得最多的方法。 (4)引文:将文献所引用的参考文献的作者、篇名、来源出版物抽取出来进行标引。 此外,还有责任人(作者)、摘要等。 自然语言检索系统对同义词、近义词、多义词和其他一些与其相关的词语没有进行规范和统一,词间缺乏有机的联系。当用户提问的检索概念具有多种表达形式时,采用单一的关键词或自然语言索引词匹配方式势必会影响查全率。自然语言检索系统的选词没有严格限制,词量过多过杂,这势必会影响查准率。 思考题 1.检索语言具有哪些功能? 2.分类语言使用较多的是哪种分类法? 信息检索语言 The Language information retrieval 1.检索语言的概念 2.检索语言的功能 3.检索语言的分类 第一节 信息检索语言 信息检索语言就是信息组织和信息检索时所使用的语言(包括自然语言)。信息检索语言是文献信息标引的规则和标准,标引人员可用它来标引文献以便将文献整理、加工、存储于检索系统中,同时,检索人员可用它来表达检索课题信息的内容,以便把特定文献从检索系统中检索出来。 因此,检索语言就是一种把文献的存储与检索联系起来,把标引人员和检索人员沟通起来的约定人工语言。 1.检索语言的概念 2.检索语言的功能 通过分析信息存储和检索的全过程可以看出检索语言大致 有以下四点主要功能: ①对文献的信息内容及其外表特征加以规范化的标引 ②对内容相同及相关的文献信息加以集中或揭示其相关性 ③可使文献信息的存储集中化、系统化、组织化,便于检 索者按一定的排列次序进行有序化检索。 ④便于将标引用语和检索用语进行相符性比较 检索语言在检索中的作用 例如:有三篇文献篇名如下: 文献1:A Model of multimedia information retrieval 文献2:The Information retrieval in chemistry WWW server 文献3:ERIC resources 在对信息存储的过程中,对这三篇文献内容分别进行了分析,并使用检索语言对其进行标引,标引结果为: 文献1:篇名(title): A Model of multimedia information retrieval 主题(subject): information retrieval, multimedia computer applications 文献2:篇名(title): The Information retrieval in chemistry WWW server 主题(subject): chemistry, educational materials 文献3:篇名(title): ERIC resources 主题(subject): educational materials 标引后这三篇文献分别被存储进数据库。 在信息检索过程中: 如果用户输入“information retrieval”一词,并将检索范围限定在篇名中,则文献1与文献2符合用户要求,成为检索结果。 如果用户输入“information retrieval”一词,并将检索范围限定在主题中,则只有文献1符合用户要求,成为检索结果。 如果用户输入“educational materials”一词,并将检索范围限定在主题中,则文献2和文献3符合用户要求,成为检索结果。 在上述例子中,“information retrieval”、“educational materials”都是检索语言,篇名和主题则是检索语言的标识,检索系统就是通过他们将用户需求与信息内容进行运算匹配,最终找到检索结果的。 由这个例子可以看出,检索语言的主要作用就是对文献的外部特征和内容进行多层次描述,提供多种检索途径,以方便用户从不同角度检索查找。 3.1 分类检索语言 文献分

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档