网站大量收购闲置独家精品文档,联系QQ:2885784924

非流行边的预测.pptVIP

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
非流行边的预测

Roger Kahn Roger Kahn 非流行边的预测 问题描述 如何刻画边的流行性?(popularity) 数学角度 问题描述 为什么要考虑非流行边? 实际应用(非流行边的信息量往往更大 ) 化学反应网络 基因调控网络 网络演化的观点(网络成熟后,hub节点趋近于饱和,新出现的连边往往是非流行的) 中国航空网 基于网络结构的相似性指标 基于相似性——两个节点之间相似性越大,它们之间存在连边的可能性也就越大。分为基于节点属性的相似和基于网络结构的相似。基于网络结构的相似性指标又分为: 基于网络结构的相似性指标 Sorensen Index Hub promoted Index (HPI) Hub Depressed index (HDI) Leicht-Holme-Newman-I (LHN-I) Preferencial Attachment (PA) 基于网络结构的相似性指标 Adamic-Adar (AA) Resource Allocation (RA) 基于网络结构的相似性指标 Katz(考虑所有路径数,且对于短路径赋予较大的权重,对长路径赋予较小的权重) 基于网络结构的相似性指标 网络的popularity累积分布 网络的PA指数 PA指数: 边的预测精度随popularity的变化 测试集中边的预测精度:该边的分数比网络中不存在的边分数高的概率。 边的预测精度随popularity的变化 大部分指标预测精度与边的popularity成反比。PA指标最为明显。 相对于其他指标,LHN指标的预测精度随popularity的波动不大,在某些网络中popularity小的边的预测精度反而要高些。 不同测试集时各指标的表现 数据划分: 根据原始数据计算出各边的popularity,然后对所有边按其popularity进行升序排列,并按所占比例进行5等分。分别从等分区间取出10%作为测试集。P=0.2对应的是[0, 20%]这一区间,P=1对应的是[80%, 100%]。 现象: 1、对于NS数据集,除了PA算法的预测精度与测试集中平均popularity呈正比例关系外,其他算法的预测精度都只是随P的增加有很小的波动。(NS网络的H值比较小) 2、在PB、CE、USAir三个数据集中,大部分的基于网络结构的链路预测算法的预测精度与p呈现正比例关系,尤其是PA、CN、AA、RA、LP。 3、相对于其他算法,LHN算法对popular边以及unpopular边的预测精度相差不大,有时候还会出现预测精度随P的增加还有所下降的情况。 不同测试集时各指标的表现 Top-L-popularity Top-L-popularity: 排在前面的L条边的平均的popularity. USAir、PB、C.elegans、NetScience四个网络中,LHN-I以及LHN-Ⅱ计算出的Top-L-popularity远小于其他指标。L越小,这种差距越明显。CN、PA、AA、RA、LP、Katz的top-100-popularity远远大于LHN指标。 结论: LHN指标更倾向于预测出非流行边。 Top-L-popularity 调节节点度的影响 下步的工作 现有的基于相似性的指标大都更倾向于预测流行的连边。LHN指标的对非流行边的预测精度比较好。但是LHN总体上的表现又不那么令人满意,能否设计一种对流行边和非流行边预测精度都比较高的相似性指标? * * 电子科技大学互联网科学中心 朱郁筱 yuxiao-zhu@ 物理角度(乘积动力学) Node-dependent Indices Common Neighbors (CN) Salton Index Jaccard Index Path-dependent Indices Local Path (LP) :在CN的基础上考虑了三阶邻居的贡献 A:邻接矩阵 :自由参数 :权重衰减因子,为了保证数列的收敛性,要小于邻接矩阵A的最大特征值的倒数 A:邻接矩阵 I : 单位阵 Leicht-Holme-Newman-Ⅱ (LHN-Ⅱ) D :邻接矩阵A的度矩阵 m : 边的条数 :矩阵A的最大特征值 : 自由参数 1)基于路径的相似性指标表现要好,但是它比基于节点的相似性指标需要的信息量多。 2)两种LHN指标的表现都不理想。 局限性:没有考虑这些指标对流行边和非流行的预测精度差别。 Random(PA): 同等规模随机网络的平均popularity M: 网络边的条数 332 2126 0.749 -0.20

文档评论(0)

ailuojue2 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档