- 1、本文档共61页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
摘要
网络为公众提供了更开放平等的交流平台的同时,使公众能随时获取和分享
一手资讯。但网络是一把双刃剑,不仅会引发大规模的舆情危机,也能成为社会
情绪的减压阀。在互联网时代,网络逐渐成为信息传播的主要媒介之一,信息通
过网络传播的速度越来越快,公众通过网络参与话题讨论的频率也越来越高。其
中,突发公共事件在网络传播的过程中更容易演变成舆情危机,如果媒体人及政
府及时发现问题,澄清谣言并疏导公众负面情绪,就能将其遏制在萌芽状态。
鉴于此,为帮助政府及媒体人更高效地开展网络舆情监管工作,本文搭建了
一种混合模型,该模型在挖掘评论文本主题的同时,探究网民的情感走势,以提
升舆情分析的全面性和准确度。在主题挖掘方面,该模型借助层次狄利克雷混合
过程模型(HDP-vMF)细粒度提取微博评论中的热门主题。HDP-vMF将每条评
论数据视为独立的小组,基于组数据聚类法进行细粒度主题提取,并将Gaussian
分布替换为von-MisesFisher分布使得所有的簇被均匀映射到一个单位超球面
上,而不是鼓励所有的簇都向原点聚集,从而减小聚类时产生的误差。在情感演
化分析方面,利用深度迁移学习模型(BERT)对微博评论数据进行细粒度情感
分类建模。由注意力网络组成的BERT,在利用并行运算显著地提升运行速度的
同时,多头注意力机制也增强了模型语义分析理解的能力,为评论情感分析研究
提供了更加匹配的理论算法。
2021719
在实证分析方面,本文以“河南暴雨”事件为例,抓取年月日至
7月31日的相关话题微博评论数据,共计120791条。初步清洗数据后,先利用
jieba工具对数据进行分词处理,并使用word2vec与BERT将分词后的数据转换
为词向量;然后,通过加权平均词向量获得句子向量,使用BERT实现评论数
据的情感分类,并基于此绘制情感演化图;最后,借助HDP-vMF模型提取评论
数据的主题词,得到微博用户关注的热点话题。实证分析结果表明:(1)情感
演化方面:在舆情爆发期,微博用户的负面情绪居多,但在整个周期内,总体情
绪倾向为正向。(2)热议话题方面:“河南暴雨情况”为微博用户讨论的核心
话题。随着事件的进一步发展,衍生了多个热点话题,其中,“地铁四号线被淹”
K599
“明星及企业网络捐款”“列车被困”“求救文档”为热度排名前四的话
题,经与微博热搜话题验证,HDP-vMF能有效地挖掘真实主题。(3)BERT性
能方面:通过将BERT与6种学术界常用的情感分类算法进行性能验证,BERT
ACCF1BERT
的及值均位列第一,验证了在情感分类方面的优越性能。
关键词:BERT;HDP-vMF;主题挖掘;情感演化;河南暴雨
I
Abstract
TheInternetprovidesamoreopenandequalcommunicationplatformforthe
public,whileenablingthepublictoaccessandsharefirst-handinformationatany
time.However,theInternetisadouble-edgedsword,whichwillnotonlytriggera
large-scalepublicopinioncrisis,butalsobecomeareliefvalveforsocialemotions.In
theInternetera,thenetworkhasgraduallybecomeoneofthemainmediaof
informationdissemination.Thespeedofinformatio
文档评论(0)