网站大量收购闲置独家精品文档,联系QQ:2885784924

《第2讲.网络链接分析理论.ppt

  1. 1、本文档共79页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
4.1链接分类理论 不同的实验证明:可用于链接分析的有效链接仅占20%左右。 链接分类研究的意义在于:从链接总体中剔除不符合“推荐、认可”的链接,以提高入链接、网络影响因子、PageRank算法等链接指标用于网页/网络重要性评价的效率。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 4.1链接分类理论 目前学者们在理论方法和实证分析过程中得出了很多有意义的结论,但是也存在如下几个问题: 不同的学者根据不同的标准建立了不同的分类体系,这是不利于链接分析研究的。 当前国内外的链接分类研究主要依赖于小样本的主观分类,而对于海量链接,主观分类不适用,所以,下一步的研究方向应是针对海量链接开发自动链接分类方法(即“链接识别”)。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 4.1链接分类理论 国外代表性的链接分类 学者 Borgman等 A.G. Smith Bar Ilan Jepson Heting Chu 研究对象 推荐链接 合作链接 相关链接 资源链接 通讯链接 分类 导航链,所有权链,社会链接和没有用的链接 非实质性研究,实质性研究(一般信息链接,正式研究引用,支持赞助商/鸣谢,关于链接创建者的自链接,相关网页,地理信息,广告,软件下载九类) 面向研究的,教育相关的,职业或工作相关的,行政管理的,一般信息的,个人的,社会的,技术的,导航的,表面的,其他和无法定义的。 科学性质的,与科学相关,教学,低质量的,“噪音” 服务、主页、研究、教学 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 4.1链接分类理论 国内代表性链接关系分类 研究学者 刘雁书等 邱均平等 研究对象 站外链接 内部链接 站外链接 类型 推荐链接 合作链接 相关链接 资源链接 通讯链接 广告链接 网站结构链接 信息关联链接 信息推荐链接 信息来源链接 网络结构链接 动机 正反面引用。 引用服务,主办单位,信息来源,内容相关。 反映内容相关程度。 链接被链网页的某种资源。 链接到通讯服务。 商业广告,服务相关,个人网站资助性广告。 体现网站结构和层次关系。 相当于参考文献和相关主题的链接。 推荐相关内容网站,有的是商业目的。 标明信息来源,表明知识产权、责任归属。 根据访问目的选择网站,方便快速访问。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 4.1链接分类理论 国内代表性链接关系分类(续) 袁毅 学术网站 推荐链接 相关链接 引用链接 扩展链接 评价链接 关系链接 其他 肯定性链接 内容相关,利用关系。 内容引用,反映高质量网站。 背景资料,注视、数据链接。 肯定或否定评价 机构间纵向、横向、利益链接,用户链,背景链,合作链 服务链、通讯链、结构链 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 4.2链接统计理论 链接统计研究常常依赖于一个未公开的假设——所有的链接是等价的,而实践中却并非如此。 链接统计的理论基础允许链接违背假设,这样的链接视为异常。有两种方法处理异常: 第一种是手工过滤,这种方法适合小型数据集; 第二种是使用ADM(Alternative Document Model,选择性文档模型),这种方法是完全自动化的。在某些情况下,使用ADM可以减少异常对其他数据的影响。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 4.2链接统计理论 在统计链接数量之前需对链接进行分类,以便统计有效链接数量;其次还需要处理链接异常,因为异常将导致统计数量不准确。 常见的链接统计异常: 异常来源 网站自链 重

文档评论(0)

you9391 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档