- 1、本文档共2页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
实验内容
1、主要是做新浪微博的信息传播预测,也即转发预测,就是准备的预测微博转发的数量。
2、获取的新浪数据集,在文档里面,微博列表和微博转发信息。
模型是基于SIR传染病模型,根据微博的传播转发特性,引入外来用户这一概念,
传染病传播
微博传播
传染性疾病
微博信息
疾病传染
转发
已感染个体
微博信息的转发者
易感染个体
原创者/转发者的直接粉丝
基于SIR模型的改进(定义为SIRE模型)
在微博信息传播建模中,由于微博具有开放性,外来用户可以在没有关注转发微博用户的时候,自主的阅读和转发此微博,这就不同于SIR模型中传染病只能来自于已感染者。并且根据微博用户转发特性,大部分用户转发微博之后,不会再次转发同一条微博,
根据微博信息传播机制,我们的定义状态如下:
1)一条微博信息的发布者传递一条微博信息(病毒)给他的跟随者(易感染者)的概率是β,即转发此微博信息成为转发者(已感染者)。
2)转发之后,转发用户(已感染者)被治愈的概率为α,并且成为具有免疫能力的免疫者R,即不再转发此微博。
3)一个没有跟随已感染者的外来用户转发此微博的概率为γ。
在t时刻,给定一条微博信息,函数S(t)、I(t)、R(t)、E(t)分别表示转发微博的人数;在t时刻,直接跟随转发用户的数量;已转发微博的用户数量,已转发微博并且不再转发此微博的用户数量;外来用户(外来用户就是转发了此微博,但是跟转发过得用户没有直接关注或者间接关注关系的用户)数量。
根据上述定义,我们可以得出SIRE的表达式为:
其中
β:微博信息转发的概率
α:转发者成为免疫者(不再转发同一条微博)的概率
γ:外来者主动转发的概率
ω:外来者占实时转发者的比例
3、先用逻辑斯蒂回归(LogisticRegression)算法训练样本得出模型最优系数(β,α,γ,ω),(训练样本采用200条微博信息和它的转发信息)
4、再通过得到的最优系数,用到模型中,再用另外200条数据进行拟合和预测实验。
5、利用SISe+(就是参考文献中的模型)与我们提出的SIRE模型做对比试验,采用RMSE(均方根)回归系统的拟合标准差来评估模型的好坏。得出SIRE模型更好。要得到对比图形展示,还有误差数值表格。
6、对比分析拟合和预测结果,
7、另外单独做一个我们的SIRE模型的预测曲线和真实数据曲线图,
文档评论(0)