Dijkstra算法在Web结构挖掘的应用.pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Dijkstra算法在Web结构挖掘的应用.pdf

74 福建电脑 2008年第1期 Dijkstra算法在Web结构挖掘的应用 林耀进t, 王晨曦2 (1、漳州师范学院计算机科学与工程系福建漳州3530002、漳州职业技术学院计算机工程系福建漳州353000) 绍Dijkstra算汝在兵挖掘结果的应用。 【关键词】:Web结构挖掘,PageRank算法,Dijkstra算法,权重 对公式(2)求解得公式(3) 有哪些信誉好的足球投注网站引擎Croogh的成功.取决于它采用了有效的Web信息 挖掘技术。Web挖掘指在WWW上挖掘潜在的、有用的模式及 2一ID 一;旦 9』=lOE 隐藏的信息过程fIl。Web挖掘分为Web内容挖掘、Web结构挖掘 2 和Web使用挖掘。其中结构挖掘则是从人为地链接结构中获取 直暑!+墨 4A=5口 2 3 17B=8C 有用知识的过程。在设计有哪些信誉好的足球投注网站引擎等服务时。对Web页面的连 c.:B+。D+旦 。8层 (3) 2 2 3 接结构进行挖掘以得出有用的知识是提高检索的重要手段。 20C=17D D;c+墨 3 本文从Web结构挖掘人手.对W幽结构挖掘的PageRank 9C=17E EI』+曼 20层=9D 算法结合概率论进行研究应用。然后介绍Dijkstra算法在挖掘结 2 2 果中的应用。 对于页面B,E。其中页面B、E存在直接链接关系:把W(B。 1.算法的介绍 E)声明为代表B-E的回顾因子权重。W(,)表示两个页面之问 1.1 PageRank算法 的紧密链接关系,W(,)值越大说明两个页面之间关系越紧密。 在PageRank方法中的PageRank被定义为P-1:设u是一个 Web页,Fu为所有11指向的页面的集合。Bu为所有指向U的页 式(3),很容易得出图(2)Web带权重的页面结构。 面的集合。设Nu=lFuI为从u发出的链接的个数.那么U页面的 PageRank可以定义为: R似)=c’R“)/Nv — v。eBu~ (1) 其中c(1)为归一化因子(因为所有页面的RankPage之和 为一个常数)。PageRank算法的实现过程:将网页的URL对应成 -图(2)Web带权重的页面结构 唯一的整数.把每一个超链接用其整数ID存放到索引数据库 中,经过预处理后。设每个网页的初始PR值为l。通过以上的递 是一样的。如对图(2),页面A到D存在多条路径,其中:R1: 归算法计算每一个网页的PageRank值,反复进行迭代,直至结 构收敛。显然,PageRank值越大,该页

文档评论(0)

rewfdgd + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档