(基于微博活动的文本分析.docVIP

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(基于微博活动的文本分析

基于微博活动的文本分析 摘要 如今,伴随着新闻信息流越来越多的用户由服务如Twitter提供实时微博活动。在这些场所,信息是通过在其中一个跟随器接收所有的微博客从他/她的一个追随者/ followees社会网络结构共享。在了解微博作为一种新的通信和新闻传播媒介的形式的同时最近研究工作已经确定了这些系统的三个不同类别的用户:信息源,信息搜寻者和朋友。随着社交网络在注册用户数上的增长,找到相关和可靠的用户能够接收感兴趣的信息就显得至关重要了。在本文中,我们提出了一种基于微博客的内容分析和检测用户的利益在网络的拓扑结构的探索,以寻找候选人为用户推荐一个followee推荐系统。实验得出,在确定的基础上,微博客的文本分析以及几个因素,它允许作为良好的信息源用户的标识不同仿形策略的影响进行的。我们发现,用户生成内容的网络中可用的信息是丰富的,对于供用户分析并找到志同道合的人。 关键词:微博;文本挖掘;推荐系统 1.引言 微博是一种新的交流形式,每天都获得追随者。这项服务允许用户发布短消息,通常只包含文本。这些更新会显示在用户的个人资料页面,并且也立即发送到谁选择接受他们的选择的其他用户。 Twitter是微博客系统的公认领导者。这个网上社交网站已经吸引了用户的注意力传播新闻和信息的手段。不像许多其他在线社交网络如Facebook ,将hi5 ,Orkut或MySpace的用户在其中建立主要是基于“友谊”关系他/她的社会关系,它已经证明,只有22.1 %的Twitter的关系的往复运动[1]。事实上, Twitter的连接, 77.9 %是单向的,除了一个事实,即不遵守他们的任何followees的是,这些用户很可能使用Twitter作为一个信息源,而不是作为一个社交网站的明确指标用户的67.6 % 。 虽然Twitter的鸣叫或岗位都不允许有140个字符的限制内的任何文字内容,很多用户只能发布有关特定主题的信息,如体育,电影,音乐或特定的摇滚乐队。这些用户可以被认为是信息源或广播。与此相反,许多人使用Twitter来获取有关特定主题的信息,如RSS阅读器的一种形式,登记自己为自己喜欢的艺术家,名人,博客,或电视节目的追随者。对于用户找到优质可靠的信息源在不断增加Twitter社区的这最后一种类型变成一个具有挑战性的问题。 上述事实,除了在注册用户在Twitter上数的大爆炸, 1、让我们相信,信息有哪些信誉好的足球投注网站的用户将受益于一个推荐系统能显示的信息来源,他们可能会对以下。在本文中,我们研究从Twitter的用户建模的角度。我们的目标是提供建议,信息有哪些信誉好的足球投注网站者关于发布鸣叫,可能是他们感兴趣的用户。 Twitter的本身已经包括了“谁遵循”系统, 2、但还提供了有关使用提出建议的信息是,“建议是基于几个因素,包括你跟随的人,他们关注的人”的唯一信息。 3、不同于其他作品,专注于用户排名按照其在整个网络中的影响,该算法探讨从目标用户的关系达到一定的级别开始,让更多的个性化因素被认为是网络在人选推荐的选择。举例来说,后面跟着别人后面一些相同的人比我的其他用户,可以认为是有趣的人跟随。 不同于传统的推荐系统,我们没有提供有关对他/她喜欢的项目或不喜欢评级的形式了用户的利益的明确信息。对于分析一个Twitter用户,我们需要采取可以从用户交互,内容流和网络的拓扑结构导出上下文的优势。也有关于一个用户,例如他/她自己的生物信息的其他来源,但它已经表明,许多用户要么不提供生物或它们具有生物不提供任何局部信息。初步的研究也认为Twitter上列出的元数据来推导出一个Twitter用户感兴趣的课题。在这项工作中,我们使用的追随者/ followees网络的结构和发表在这个网络中,建议人们,与用户共享相同的内容相关的利益,谁将会收到建议的手段的鸣叫。 几个分析策略进行了分析和评估建模基于两种常用的方法在Twitter上用户的利益。第一种方法模型,通过分析他/她自己的微博内容,而第二个方法代表用户通过他们的followees的推特用户。在第二种方法中,三种不同类型的访问被认为是:由设置他/她的followees的访问的建模的目标用户,由他/她的followees型材的聚合或由一组可通过以下发现类根据自己的推特内容聚类他/她的followees 。 这项工作的其余部分组织如下。第2节讨论涉及到我们工作的其他研究工作。第3节介绍了基于内容的方法来followee建议,问题,帮助信息有哪些信誉好的足球投注网站用户在Twitter的。在第4节的实验进行了验证使用Twitter的数据集的方式报告。最后,第5节讨论所取得的成果,并提出我们的结论和未来的工作。 2相关工作 2.1 .在在线社交网络的链接预测 帮助用户查找和与人上线连接到带

文档评论(0)

lunwen1978 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档