- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
WWW网络信息检索技术概述.
WWW网络信息检索技术概述
郭 峰
(海南大学信息学院电子信息工程系2000级)
摘要:本文针对网络有哪些信誉好的足球投注网站引擎工作中的重点技术作出详尽的阐述,它包括Robot程序、索引数据库、检索程序三个方面。通过他们来概述WWW网络信息检索技术的发展状况。
关键词:Robot程序、数据索引、遍历算法、相关性
The abstracts of information retrievals on the world wide web
guofeng
( Information college of Hainan university 2000 )
Abstract: This scheduals decribe the details of fatal techniques about the information on the world wide website ,including three aspects: Robot techniques,Indexing database and searching programmes .We can learn the developing states of information retrivals through them.
Key words: Robot, Indces, Revelance, arithmetic
随着互联网的发展,网络信息不断爆炸式的扩张,网民怎么才能从这样海量的信息中找到他们所需要的信息呢?有哪些信誉好的足球投注网站引擎,这是目前为止,世界上最流行的一种准确获得信息的一种工具。象Google、Altavista、Infoseek 、Hotbot、Yahoo、网络指南针、北大天网和华好网景的ChinaOK等等。这些都是世界上非常著名的有哪些信誉好的足球投注网站引擎。他们都是通过网络机器人搜集网络信息,建立索引数据库,并且不但的更新,通过一定的相关性算法,对用户提供的请求作出响应,并按一定的次序输出高质量的信息。它的主要由下面三个部分组成:蜘蛛程序、索引数据库、检索程序。三个部分协调一致,其工作原理(图1)如下:
1 Robot技术程序
Robot是一种计算机的程序 ,可以自动地在网络中穿梭 ,该程序最重要的功能是使用索引策略 ,也就是查找网站和网页的次序。可以用题目、URL、关键词进行索引 ,也可以是以上几项的某种组合。由于Internet的数据量大 ,在现有的机器和网络条件下 ,有哪些信誉好的足球投注网站引擎只能对部分Internet上的资料进行采集 ;加上有哪些信誉好的足球投注网站的索引策略不同 ,所以对相同关键词的有哪些信誉好的足球投注网站在不同的有哪些信誉好的足球投注网站器上可以有截然不同的结果。如果把整个Internet看作是一个图或一棵树的话 ,可以发现Robot技术的基本工作原理和人工智能中的有哪些信誉好的足球投注网站树一样 ,这在计算机中可以方便地使用递归方法实现 ,具体如下:
(1 )根据首页进行有哪些信誉好的足球投注网站 ,相当于有哪些信誉好的足球投注网站树的根 ;
(2 )根据首页的第 1个链接到下一个页面 ;
(3)重复 (1 )和 (2 );(4)到某页已经没有链接 ,回退上一级页面的下一个链接 ,如此循环往复。
但若要建立全面的索引数据库 ,必须对WWW系统进行遍历。我们可以进行这样假设 :将WWW作为一个有向图处理 ,将页面看作图中的节点 ,页面中的超链看作图中的有向边。因此可以使用有向图遍历算法 (深度优先或广度优先算法或启发式方式 )对其进行遍历。WWW是个典型的C S结构系统 ,所以可在一台主机上完成WWW遍历。
遍历一般采用以下 3种方法 :
(1)定一个种子URL ,Robot从种子URL开始对WWW遍历 ;
(2)定一组不同类别、被访问频率高的URL ,Robot从这些URL开始遍历 ;
(3)据域名或IP地址将WWW空间划分为多个子空间 ,运行多个Robot程序并行地在不同子空间中进行遍历。在实际使用中 ,一般是将这三种方法组合起来使用。按照上述遍历算法 ,Robot可以系统地、周期性地访问WWW ,从而建立较为全面的索引库 ,并能保持对库的不断更新。
在遍历算法中,一般用到了两种方式,深度优先和广度优先两种基本的有哪些信誉好的足球投注网站策略。Robit以URL列表存取的方式决定有哪些信誉好的足球投注网站策略:
(1) 先进先出,则形成广度优先有哪些信誉好的足球投注网站。当起始列表包含有大量的Web服务器地址时,广度优先有哪些信誉好的足球投注网站将产生一个很好的初始结果,但很难深入到服务器中去。
(2) 先进后出,则形成深度优先有哪些信誉好的足球投注网站。这样能产生较好的文档分布,更容易发现文档的结构,即找到最大数目的交叉引用
在实际使用中 ,一般是将这三种方法组合起来使用。按照上述遍历算法 ,Robot可以系统地、周期性地访问WWW ,从而建立较为全面的索引库 ,并能保持对库的不断更新。在遍历的过程中 ,为了提高其效率 ,可以融入人工智能的方法使其变得智能化 ,以下为可行的
文档评论(0)