网站大量收购闲置独家精品文档,联系QQ:2885784924

一种面向微博主题挖掘的改进LDA模型.pdf

一种面向微博主题挖掘的改进LDA模型.pdf

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种面向微博主题挖掘的改进LDA模型.pdf

第6期 华东师范大学学报(自然科学版) No.6 2013年11月 Normal NOV.2013 JournalofEastChina Science) University(Natural 文章编号:1000—5641(2013)06—0093—09 一种面向微博主题挖掘的改进LDA模型 谢 昊, 江 红 (华东师范大学计算中心,上海200062) 摘要:随着新浪微博用户的不断增长,微博网站成为很多人获取信息的平台.但是微博是一种 特殊的文本,其字数受到严格限制,传统的主题模型并不能很好地分析微博的内容.本文提出了 一个基于LDA的微博生成模型RT—LDA来解决微博字数受限的问题.模型采用吉布斯抽样法 来推导,不仅能准确地挖掘每条微博的主题,还能归纳出用户关注的主题分布情况.在真实数据 集上的实验表明,RT-LDA模型能很好地对微博进行主题挖掘. RT—LDA; 关键词:新浪微博; 文本挖掘; 吉布斯抽样 中图分类号:TP39文献标识码:A LDAmodelfor Improved microblogtopicmining XIE Hao,JIANG Hong ChinaNormal Center,East 200062,China) (Computer University,Shanghai WiththedramaticincreaseofSina Abstract: websiteshavebeenthe microblogusers,microblog forawide ofusers tO information.DuetOthefactthat isa platforms spectrum get microblog kindoftextwiththerestricted modelscouldnotbeusedtOana— special length,traditionaltopic the content lyze well.RT—LDA,a modelbasedonLDAis microblogvery microbloggeneration inthis ischosentOdeducethemodel,whichcannot mine proposedpaper.Gibbssampling only the ofeach butalsoinducethedistributionoftheconcerned

您可能关注的文档

文档评论(0)

文档精品 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档