网站大量收购闲置独家精品文档,联系QQ:2885784924

p2p收索引擎文献综述.docVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
p2p收索引擎文献综述

中文有哪些信誉好的足球投注网站引擎技术与P2P技术简介 李瑞敏 (一)中文有哪些信誉好的足球投注网站引擎技术概述 互联网在近年飞速发展,互联网已经深入人们的生活,并慢慢改变人们的生活,从“网络广告”到“拇指经济“,从“网络游戏”到“有哪些信誉好的足球投注网站力经济”。目前有哪些信誉好的足球投注网站引擎已经成为互联网行业中最受人们关注的焦点。有哪些信誉好的足球投注网站引擎的基础技术是全文检索,20世纪60年代,国外就已经开始对全文检索技术进行研究。其核心是对文本信息的索引和检索,一般用于企事业单位。随着互联网的发展,有哪些信誉好的足球投注网站引擎在全文检索技术上发展起来,并得到了广泛的应用。 有哪些信誉好的足球投注网站引擎结合互联网发展的特点形成了三种典型的类型: (1)全文检索有哪些信誉好的足球投注网站引擎: 国外具代表性的有Google、yahoo、AllTheWeb等,国内著名的有百度。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,也是目前常规意义上的有哪些信誉好的足球投注网站引擎。 (2)目录有哪些信誉好的足球投注网站引擎: 目录索引虽然有有哪些信誉好的足球投注网站功能,但在严格意义上算不上是真正的有哪些信誉好的足球投注网站引擎,仅仅是按目录分类的网站链接列表而己。用户完全可以不用进行关键词查询,仅靠分类目录也可找到需要的信息。国外比较著名的目录索引有哪些信誉好的足球投注网站引擎有Yahoo、Open Directory Project、LookSmart等。国内的搜狐、新浪、网易有哪些信誉好的足球投注网站也都具有这一类功能。 (3)元有哪些信誉好的足球投注网站引擎: 元有哪些信誉好的足球投注网站引擎在接受用户查询请求时,同时在其它多个引擎上进行有哪些信誉好的足球投注网站,并将结果返回给用户。著名的元有哪些信誉好的足球投注网站引擎有Dogpile、Vivisimo等。在有哪些信誉好的足球投注网站结果排列方面,有的直接按来源引擎排列有哪些信誉好的足球投注网站结果,如Dogpile,有的则按自定的规则将结果重新排列组合如Dogpile。其他的像新浪、网易、等有哪些信誉好的足球投注网站引擎都是调用其它全文检索有哪些信誉好的足球投注网站引擎或者在其有哪些信誉好的足球投注网站结果的基础上做了二次开发。 中文有哪些信誉好的足球投注网站引擎基本技术分析有哪些信誉好的足球投注网站引擎的门槛主要是技术门槛包括网页数据的快速采集、海量数据的索引和存储、有哪些信誉好的足球投注网站结果的相关性排序有哪些信誉好的足球投注网站效率的毫秒级要求、分布式处理和负载均衡、自然语言的理解技术等等这些都是有哪些信誉好的足球投注网站引擎的门槛。 有哪些信誉好的足球投注网站引擎可以主要划分为如下几大基础技术模块: (1)抓取互联网数据 通过自动抓取网页的蜘蛛程序广度遍历整个互联网,并且保存访问过的网站页面以供程序分析。 (2)建立索引数据库 由索引系统对收集到的网页进行分析,提取相关网页信息,根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度,然后用这些相关信息建立网页索引数据库。 (3)有哪些信誉好的足球投注网站索引数据库 当用户输入关键词有哪些信誉好的足球投注网站后,分解有哪些信誉好的足球投注网站请求,由有哪些信誉好的足球投注网站系统程序从网页索引数据库中找到符合该关键词的所有相关网页。 (4)有哪些信誉好的足球投注网站结果的排序 所有相关网页针对该关键词的相关信息在索引库中都有记录,只需综合相关信息和网页级别形成相关度数值,然后进行排序,相关度越高排名越靠前。最后由页面生成系统将有哪些信誉好的足球投注网站结果的链接地址和页面内容摘要等内容组织起来返回给用户。 主要的一些技术: 网络蜘蛛:通过网页的链接地址来寻找网页。从网站某一个页面通常是首页开始读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。 在抓取网页的时候网络蜘蛛一般有两种策略:广度优先和深度优先。广度优先是指网络蜘蛛会先抓取起始网页中链接的所有网页,然后再选择其中的一个链接网页继续抓取在此网页中链接的所有网页。这是最常用的方式。因为这个方法可以让网络蜘蛛并行处理提高其抓取速度。深度优先是指网络蜘蛛会从起始页开始一个链接一个链接跟踪下去处理完这条线路之后,再转入下一个起始页继续跟踪链接。 排序技术:在有哪些信誉好的足球投注网站引擎的数据库中普通一个有哪些信誉好的足球投注网站往往有上百万条结果,如何按照某种方式对结果排序,最终展示给访问者,是有哪些信誉好的足球投注网站引擎中一个基本而关键的技术。排序技术的好坏直接影响到有哪些信誉好的足球投注网站引擎的性能优劣。经过多年的发展目前已经有多种排序技术PageRank技术、超链分析技术、HillTop技术、锚文本、页面版式。 中文分词技术是关键技术:直接影响相关排序技术的准确的程度,现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。 (1)基于字符串匹配的分词方法 这种方法又叫做机械分词方法。它是按照一定的策略将待分析的汉字串与一个“充分大”的机器词典中的词条进行匹配。若在词典中找到某个字符串,则匹配成功识别出一个词。按照扫描方向的不同串匹配,分词方法可以分为正向匹配和逆向匹配。按照不同长度优先匹配的情况,可以分为最大最长匹配和最小最短匹配。按照是否与词性标注过程相结合,又可以分为单纯分词方法和分词与标注相结合的一体化方法。 对于

文档评论(0)

2017ll + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档