网站大量收购闲置独家精品文档,联系QQ:2885784924

网络检索ppt课件.pptVIP

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络检索ppt课件

网络检索 李 柯 2010-12 有哪些信誉好的足球投注网站引擎的发展 第一代有哪些信誉好的足球投注网站引擎——基于关键词的检索 第二代有哪些信誉好的足球投注网站引擎——基于超链接的检索 第三代有哪些信誉好的足球投注网站引擎——基于概念的检索 第一代有哪些信誉好的足球投注网站引擎 基于关键词的检索是利用关键词索引来获取文档,即整个文档的内容通过这些关键词进行表示,同样,用户的检索提问式也用一组关键词来表示。然后利用关键词将文档与提问式进行匹配,计算文档与提问式的相关程度。 布尔模型 向量空间模型 概率模型 第二代有哪些信誉好的足球投注网站引擎 基于超链接的检索也称链接分析,是有哪些信誉好的足球投注网站引擎面对网络这一动态环境,所采用的一种新的检索排序方法。 基本思想 PageRank算法 HITs算法 超链接分析的基本思想 主要是来自传统的文献计量学中的文献引文分析。传统的文献引文分析认为,一篇学术论文的价值很大程度上体现在它被其他学术论文作为参考文献饮用的次数,即被其他学术论文引用得越多,这篇论文的价值就越高。 超链接分析充分利用了网络自身的超链接结构,提出了一个假设,即网页的重要性可用其他网页对其超链接的数量来衡量。 超链接分析的基本思想 一般地,我们把一个由网页A指向网页B的超链接理解为网页A中包含对网页B的引用,则超链接分析最简单直接的应用是:指向一个网页的超链接数目越多,则这个网页的重要性就越高。 也可以这样理解: 网页A指向网页B的链接 由网页A对网页B投了一票。 PageRank概念 PageRank(网页级别),2001年9月被授予美国专利,专利人是Google创始人之一拉里·佩奇(Larry Page)。 它是Google排名运算法则(排名公式)的一部分,是Google用于用来标识网页的等级/重要性的一种方法,是Google用来衡量一个网站的好坏的唯一标准。 PageRank概念 Google的PageRank根据网站的外部链接和内部链接的数量和质量来衡量网站的价值。PageRank背后的概念是,每个到页面的链接都是对该页面的一次投票,被链接的越多,就意味着被其他网站投票越多。这个就是所谓的“链接流行度”——衡量多少人愿意将他们的网站和你的网站挂钩。 PageRank分值从0到10,PR值越高说明该网页越受欢迎。 PageRank定义 基本思想:如果网页T存在一个指向网页A的连接,则表明T的所有者认为A比较重要,从而把T的一部分重要性得分赋予A。这个重要性得分值为: PR(T)/C(T)。 其中PR(T)为T的PageRank值,C(T)为T的出链数,则A的PageRank值为一系列类似于T的页面重要性得分值的累加。 PageRank定义 L.Page等人对PageRank的定义: PageRank定义 假设前提:即认为所有的网页形成一个牢固的链接图,每个网页都能从其他网页通过超链接到达。定义中给出的PR值都可以根据所有链接到它的网页的PR值除以各自向外的超链接数的商再进行求和。 假如一个人对网页上的超链接的点击是随机的,在牢固链接图的假设前提下,可以到达任一网页,只是到大的可能性大小不同。 显然,网页链入的超链接数越多,到达的可能性就越大,相应的PR值就越高。对于PR值高的网页链接到的网页,到达的可能性也就越大,其PR值也相应越高。 PageRank计算(一) 利用PageRank的公式定义可以计算网页集合中所有网页的PR值。假设S为整个网页的总和,由于所有网页的PR值开始都是未知的,我们进行平均分配,给每个网页的PR值都赋予1/S,再根据公式定义进行计算,然后对得到的值再次利用公式定义,这样循环反复,直到计算所得的PR值收敛于一个相对固定的值。 算法如下: PageRank计算(一) 任意 While {for each ; ; ; for each ; ; } PageRank计算(一) 算法中PR(P)i表示进行i次循环计算后的PR值,C的计算是保证总PR值为1 L.Pag

文档评论(0)

118zhuanqian + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档