新浪微博的信息传播预测---数学建模.docx

新浪微博的信息传播预测---数学建模.docx

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

实验内容

1、主要是做新浪微博的信息传播预测,也即转发预测,就是准备的预测微博转发的数量。

2、获取的新浪数据集,在文档里面,微博列表和微博转发信息。

模型是基于SIR传染病模型,根据微博的传播转发特性,引入外来用户这一概念,

传染病传播

微博传播

传染性疾病

微博信息

疾病传染

转发

已感染个体

微博信息的转发者

易感染个体

原创者/转发者的直接粉丝

基于SIR模型的改进(定义为SIRE模型)

在微博信息传播建模中,由于微博具有开放性,外来用户可以在没有关注转发微博用户的时候,自主的阅读和转发此微博,这就不同于SIR模型中传染病只能来自于已感染者。并且根据微博用户转发特性,大部分用户转发微博之后,不会再次转发同一条微博,

根据微博信息传播机制,我们的定义状态如下:

1)一条微博信息的发布者传递一条微博信息(病毒)给他的跟随者(易感染者)的概率是β,即转发此微博信息成为转发者(已感染者)。

2)转发之后,转发用户(已感染者)被治愈的概率为α,并且成为具有免疫能力的免疫者R,即不再转发此微博。

3)一个没有跟随已感染者的外来用户转发此微博的概率为γ。

在t时刻,给定一条微博信息,函数S(t)、I(t)、R(t)、E(t)分别表示转发微博的人数;在t时刻,直接跟随转发用户的数量;已转发微博的用户数量,已转发微博并且不再转发此微博的用户数量;外来用户(外来用户就是转发了此微博,但是跟转发过得用户没有直接关注或者间接关注关系的用户)数量。

根据上述定义,我们可以得出SIRE的表达式为:

其中

β:微博信息转发的概率

α:转发者成为免疫者(不再转发同一条微博)的概率

γ:外来者主动转发的概率

ω:外来者占实时转发者的比例

3、先用逻辑斯蒂回归(LogisticRegression)算法训练样本得出模型最优系数(β,α,γ,ω),(训练样本采用200条微博信息和它的转发信息)

4、再通过得到的最优系数,用到模型中,再用另外200条数据进行拟合和预测实验。

5、利用SISe+(就是参考文献中的模型)与我们提出的SIRE模型做对比试验,采用RMSE(均方根)回归系统的拟合标准差来评估模型的好坏。得出SIRE模型更好。要得到对比图形展示,还有误差数值表格。

6、对比分析拟合和预测结果,

7、另外单独做一个我们的SIRE模型的预测曲线和真实数据曲线图,

文档评论(0)

159****1944 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档