互联网信息的检索技术.docx

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

?

?

互联网信息的检索技术

?

?

杜喜

摘要浩瀚的互联网信息为各种各樣的需求提供了难以穷尽的源泉,因而信息的检索也就成为了重要的环节。随着信息技术的进一步发展,信息检索手段也在不断完善,它为计算机用户与海洋般的信息之间建起一条更加快捷更加方便的桥梁。本文就互联网信息检索作了简要论述。

关键词互联网信息检索技术

中图分类号:TP393文献标识码:A

计算机技术的发展与完善,信息检索便成为了重要的桥梁。早在上世纪六十年代,美国海军机械试验中心使用IBM701型机,初步建成了计算机情报检索系统,这也预示着以计算机检索系统为代表的信息检索自动化时代的到来。单纯的手工检索和机械检索都或多或少显露出各自的缺点,因此,新型的信息检索方式应运而生。1965年,美国系统发展公司研制成功ORBIT联机情报检索软件,开启了联机情报检索系统阶段。与此同时,美国洛克公司研制成功了著名的Dialog检索系统。且随着20世纪70年代卫星通信技术、微型计算机以及数据库产生的同步发展,用户得以冲破时间和空间的障碍,实现了国际联机检索。联机检索是计算机、信息处理技术和现代通信技术三者的有机结合。随着互联网的迅速发展及超文本技术的出现,基于客户/服务器的检索软件的开发,实现了将原来的主机系统转移到服务器上,使客户/服务器联机检索模式开始取代以往的终端/主机结构,联机检索进入了一个崭新的时期。信息检索系统类型包括:参考数据库检索系统,它以二次文献数据库为主,提供文献的题录、文摘数据或事实数据。全文数据库检索系统是近年来随着数字化技术不断成熟而发展起来的,系统能提供文献的全文数据,包括图表、图像等多种形式的媒体。Internet有哪些信誉好的足球投注网站引擎主要提供网上资源的链接,某些有哪些信誉好的足球投注网站引擎也提供简单的网页介绍或检索词的上下文。

从信息检索方式来说,命令检索方式,指的是检索过程中,每一项检索提问,必须通过具体的命令来完成,这些检索命令通常需要用户熟记。这种方式虽然对于初级用户来说比较麻烦,需要记很多的命令,但是对熟悉系统的用户来说,命令方式有其步骤简单的优点,尤其是完成一些复杂的检索算法时,操作步骤简单。单检索方式实际上是将各种检索指令转化成菜单选项,系统的功能和检索指令通过菜单和子菜单的选项来实现,用户通过菜单一目了然,只需根据需要在菜单上选择某一项,或进行检索,或显示命令中的纪录等。菜单驱动的检索方式对初级用户是比较友好的,用户不需要培训就可以自行检索,很容易入门,但对于较复杂的检索算法,常常需要进入层层菜单才能完成。其次,命令与菜单相结合的方式既保留了指令检索的方式,又提供了菜单的某些直观的功能。而主题法和分类法在信息检索中的原理基本相同。信息储存是对文献进行收集、标引及著录,并加以有序化编排。

信息检索是从大量的信息中查找出用户所需的特定信息的过程,而实施检索的主要方法就是利用各种检索工具。在主题概念表达上分类语言的一个显著特点是用码号(如字母或数字)作为文献的标识,标引或检索时都必须使用分类号。主题语言则是直接以自然语言中的话词作为标引和检索的标识。在主题概念的组织上主题法与分类法都要将主题概念组织成可迅速查找的检索工具或检索系统。分类语言主要是按学科体系或逻辑体系组织的,由于分类体系不是显而易见、易于掌握的,因此用户在使用分类检索工具或检索系统时,往往难以确定新主题、细小主题以及复杂主题在体系中的准确位置。主题语言按照语调的字顺来组织主题概念,因而可以直接依名检索。在主题内在关系的显示上分类语言中主题内在关系主要通过上下位类、同位类以及交替类目、参见类目和类目注释来显示。尤其在体系分类表中,类目之间的等级关系可以通过类目排列的位置、乃至字体的不同而直接明显地展示由来。因而分类法系统的系统性、等级性强,便于进行浏览性检索,并可以根据检索的需要进行扩检和缩检。主题语言中,主题内在关系主要通过建立词间参照系统的方式来显示。此外也通过辅助索引进行分类显示。所以,在主题词表中,相关主题之间的关系难以直接地、一目了然地展示出来,因而在族性检索、尤其是较大范围课题的检索中,不如分类语言。在标引方法上使用分类语言标引时,主题分析的重点是辨别确定文献主题的学科性质,以便进一步确定所属类目。

此外,从信息检索技术角度来说,布尔逻辑检索技术就是指利用布尔逻辑运算符进行检索词语和代码之间的逻辑组配运算,从而获得检索结果的一种检索方法。这是计算机信息检索中最基本的也是最常用的技术。对于一般用而言,截词检索(Truncation)是一种常用的检索技术,特别是在西文检索中,更是广泛使用。截词检索就是对词的片断进行比较,检索者将检索词在合适的地方截断,然后以截出的词语片断进行检索。在检索系统中,为了提高检索的准确率,缩小检索的范围,通常用一些限制的手段和方法。使用这些方法进行检索通常

文档评论(0)

152****7564 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档