- 1、本文档共51页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
独创性声明
学位论文题目: 基于LDA的社交网络链接预测模型研究
本人提交的学位论文是在导师指导下进行的研究工作及取得的研究成果。论文中引用他人已经发表或出版过的研究成果,文中已加特别标注。对本研究及学位论文撰写曾做出贡献的老师、朋友、同仁在文中作明确说明并表示衷心感谢。
学位论文作者: 签字日期: 年 月 日
学位论文版权使用授权书
本学位论文作者完全解西南大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权西南大学研究生院(筹)可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。
(必威体育官网网址的学位论文在解密后适用本授权书,本论文:□不必威体育官网网址,□必威体育官网网址期限至 年 月止) 。
学位论文作者签名: 导师签名:
签字日期: 年 月 日 签字日期: 年 月 日
目 录
摘 要 I
ABSTRACT II
第1章 绪论 1
1.1研究背景 1
1.2研究现状 2
1.3主要工作 3
1.4论文结构 4
1.5 本章小结 5
第2章 相关理论和技术 6
2.1主题模型 6
2.2复杂网络 7
2.3社交网络 8
2.3.1社交网络的发展 8
2.3.2 社交网络的定义 9
2.3.3 社交网络的数据表示 10
2.4 社交网络分析 11
2.5链接预测 13
2.5.1链接预测算法 14
2.6 本章小结 16
第3章 基于LDA的社交网络链接预测模型 17
3.1 概述 17
3.2总体框架 17
3.3 形式化描述 18
3.4用户兴趣信息特征提取 20
3.4.1 兴趣主题提取 20
3.4.2 兴趣主题相似度计算 23
3.5社交网络结构信息特征提取 23
3.6分类器的构造 25
3.7模型的可行性和有效性分析 25
3.7.1 可行性分析 25
3.7.2 有效性分析 27
3.8 本章小结 27
第4章 实验 29
4.1 实验平台 29
4.2 数据集 29
4.2.1 数据来源 29
4.2.2 社交网络的构造 29
4.2.3 数据的平衡处理 31
4.3 实验目的 31
4.3 评价方法 31
4.4 实验具体方案 32
4.5 实验结果与分析 32
4.5.1 用户兴趣信息特征 32
4.2.2 网络拓扑结构特征 34
4.2.3 结果分析与比较 34
4.6 本章小结 36
第5章 总结和展望 37
参考文献 39
致 谢 43
攻读硕士学位期间公开发表的论文 44
基于LDA的社交网络链接预测模型研究
计算机软件与理论专业硕士研究生 补嘉
指导教师 唐 雁 教授
摘 要
随着Web2.0技术的不断发展,基于社区的服务,如Wikipedia、 Flickr和Facebook等越来越流行。在社区中,人们可以寻找和上传自己喜爱的图片,可以与社区中的其他用户进行链接,成为朋友。社交网络是依靠人与人之间的朋友关系组织在一起的系统,是现实人际网络的子集。社交网络用户数量的急剧增加,给网络中用户关系、用户信息等数据的挖掘带来了巨大挑战。利用用户节点的属性信息、社交网络的拓扑结构特征等预测用户节点对之间是否存在朋友关系链接,便是其中一个研究热点。
现有的社交网络链接预测算法,如CN算法[1]、AA算法[2]、katz算法[3]等,主要关注社交网络中用户节点对之间的拓扑结构相似特征,缺乏对其属性信息之间潜在语义关系的重视,链接预测的精度不高。此外,在社交网络中,用户的兴趣信息数量巨大,如果直接对每个用户的每个兴趣进行语义关系分析,则需耗费大量时间。针对以上问题,本文引入主题模型、潜在迪里克雷分布模型(LDA, Latent Dirichlet Allocation),首先利用LDA模型对用户节点对之间的兴趣信息进行建模,提取社交网络用户兴趣信息的主题,比较主题之间的语义相似度,这与直接对每个用户的兴趣信息进行分析相比,能够在捕获信息的潜在语义关系的同时,有效降低计算时间复杂度。其次,把复杂网络中的网络资源分配算法RA(Resource Allocation)用来对社交网络的结构信息进行特征提取。然后,通过构造分类器,利用有监督学习框架综合语义特征和拓扑结构特征进行社交网络链接预测。
通过在真实的社交网络LiveJournal数据集上进行实验,与现有的链接预测算法比较,结果证明,本
文档评论(0)