- 1、本文档共46页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第一讲信息检索概论四、文献信息检索语言思考:信息检索就是从一定的文献集合(即检索系统)中查找出符合特定需要的文献,那么这个过程是如何实现的呢?第一讲信息检索概论计算机检索的基本原理:它是将用户的检索提问词与数据库文献记录中的标引词进行对比,当提问词与标引词匹配一致时,即为命中,检索成功。这里所说的“准确”,是指用户所选的检索词必须与数据库中标引文献记录所用的标引词一致。然而实际工作中,从事信息存储的人员与从事信息检索的人员绝大多数情况下不可能进行直接的思想交流,因而会造成存储信息与检索信息所依据的规则不一致,导致存入的文献检不出。为了避免这种情况发生,在信息标引人员与信息检索人员之间必须制定一种共同遵守的规则,即一种约定的相同标识和线路,这就是检索语言。第一讲信息检索概论(一)定义检索语言检索语言(informationretrievallanguage),是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言。所谓检索的运算匹配就是通过检索语言的匹配来实现的。检索语言把信息的存储与检索联系起来,把标引人员与用户联系起来,以便取得共同理解、实现交流的语言。第一讲信息检索概论(二)检索语言的工作原理1.存储:检索系统对文献内容进行分析,概括分析出若干能代表文献内容的语词,并赋予一定的标识,如题名、作者、主题词等,作为存储与检索的依据,然后纳入到数据库中。2.检索:检索人员首先要对检索课题进行分析,同样形成若干能代表信息需求的语词,然后通过检索系统在数据库中匹配具有同样语词和标识的文献,找到自己所需的信息。第一讲信息检索概论(三)检索语言的作用1.使文献成为有序的集合体,使文献信息的存储集中化、系统化、组织化,便于检索者按照一定的排列次序进行有序化检索;2.标引文献信息内容及其外表特征,保证不同标引人员表征文献的一致性;3.保证检索提问与文献信息标引的一致性;4.提供检索入口,如内部特征:主题词、分类号等。这些检索系统中的标识系统,提供检索的出发点也就是我们的检索点,如著者、分类号、主题词、关键词等;5.保证检索者按不同需要检索文献时,都能获得最高查全率和查准率。第一讲信息检索概论(四)检索语言的基本类型目前使用的检索语言包括自然语言和人工语言,前者可以为那些不懂人工语言的网络用户提供极大的便利,而前者又分为分类语言与主题语言。第一讲信息检索概论1.自然语言(naturallanguage)(1)定义检索用词是从信息内容本身抽取的,主要依赖于计算机自动抽词技术完成,辅以人工自由标引(非依据词表的标引方法),是非规范词(uncontrolledterm)。①关键词(keyword):直接从信息资源名称、正文或文摘中抽出的代表信息主要内容的重要语词。②题名:信息资源的名称,如论文篇名、图书书名、网站名称等。③全文:从资源的内部内容中自动抽取、查找,是目前网上各类有哪些信誉好的足球投注网站引擎使用的最多的方法。④引文(quotation):将文献所引用的参考文献的作者、篇名、来源出版物抽取出来进行标引。(2)优点①新颖性强:一旦文献中出现某个新词语,即可直接使用这一词语作为检索入口,根本无需像受控语言那样冥思苦想地将其转换成另一规范词用于检索。②检索方便:它解除了人工语言的种种限制,不需要复杂的检索规则,使用者能较快适应,易用性强。③标引准确度高:自然语言采用从文献中抽词标引的方式,不容易发生误标引,适用于计算机检索。只要数据库的文献标题中含有该检索词,即视为命中,健全率较高。(3)缺点:①词汇量太大,给词汇的存储、加工和检索带来许多操作性方面的困难。②当文献的主题很明白清楚地在标题或主题词中表达出来时,检索才会较成功,反之则失效。③词汇具有模糊性,另外多义、近义、同义现象较多,给标引和检索带来困难。第一讲信息检索概论2.人工语言由人工创制的,采用规范词,用来专指某个概念或与之相应的概念。可以将同义词、近义词、相关词、多义词及缩略词规范在一起,由人工控制。包括分类检索语言、主题检索语言、代码检索语言。(1)分类检索语言按学科范畴及知识之间的关系列出类目,并用数字、字母符号对类目进行标识的一种语言体系,也称分类法。中国图书馆图书分类法美国国会图书馆分类法杜威十进位分类法IPC国际专利分类表第一讲信息检索概论《中图法》的类目表由基本大类、简表、详表和复分表组成。基本大类是分类法中的第一级类目,是对
您可能关注的文档
最近下载
- 低空经济装备项目商业计划书.docx VIP
- 自由贸易区背景下海南绿色港口发展研究.docx VIP
- .STANDARD HX270操作说明书.pdf VIP
- 形容词、副词、系动词高频考点-2025年中考英语专项复习(上海专用)(原题版).pdf VIP
- 自由贸易区背景下海南绿色港口发展研究.pdf VIP
- 英语二必考500词.docx VIP
- 长沙农商银行招聘试题及答案解析.pdf VIP
- 个人简历模板空白表格-表格个人简历.docx VIP
- 高三英语二轮复习阅读理解-传统文化专题 Traditional Culture(选自China Daily).docx VIP
- 铁路货运员业务学习资料.docx
文档评论(0)