网站大量收购独家精品文档,联系QQ:2885784924

基于情感分析的视频弹幕文本研究.pdf

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

摘要

当前是信息大爆炸的时代,人们每天产生大量的数据,同时也被各种大数据

包围,被动接收大量信息。尤其是第四代通信技术(4G)的普及以及第五代通信

技术(5G)的推广,更是带来大量的数据,同时也使得视频可以在网络上被更加

通畅的传输,更加便捷的被人们所观看。由于人们对视频进行实时评论的需求越

来越旺盛,所以弹幕技术在视频领域逐渐普及。随着使用弹幕的人越来越多,对

视频弹幕进行情感分析的研究就显得尤为重要。研究不仅能帮助用户更好的了解

视频,也能帮助网络对于舆论进行更好的监督管理,使互联网环境更加美好。

本文首先使用网络爬虫技术,爬取了哔哩哔哩网站全部电视剧的弹幕数据;

然后并通过图表的形式对弹幕数据总体情况进行了详细说明;最后通过分层抽样

的方式挑选部分弹幕数据进行数据情感标注,然后将数据分为训练集、验证集以

及测试集,进行后续模型的训练。

本文主要采用BERT模型对于弹幕情感进行建模,从而获得对于弹幕文本情

感分析的模型。不同于大多数情感分析最终得到两种分类结果,本文最终得到三

种分类结果,即无情感倾向、积极情感倾向以及消极情感倾向。在获得模型

l值的获取方

Accuracy指标的基础上,增加了对于多分类模型Precision、Recall和F

法的分析。同时对比了在不同参数组合下,最终模型的结果。然后对测试集数据

情感分析结果进行分析,对不同类型的错误做出说明,并提出解决办法。之后分

别使用朴素贝叶斯模型和随机森林模型对弹幕数据进行情感分析建模,并将两种

模型结果与BERT模型的结果进行了对比,经过对比发现,BERT模型相比朴素贝

叶斯模型和随机森林模型用拥有更高的准确率。

最后使用BERT训练出来的情感分析模型,对电视剧进行情感分析。最终情

感分析模型结果完美的的契合了剧情,在剧情高潮时,积极情感倾向的弹幕数量

远高于消极情感倾向数量;在反派嚣张的时候,消极情感倾向的弹幕数量激增,

积极情感倾向弹幕数据骤减。

关键词:弹幕;情感分析;BERT

V

目录

第1章绪论………….…………。.●●.●●,

1.1研究背景与意义…….………….……一,

1.1.1研究背景….…….…………….……….….…..一,

1.1.2研究意义….…….………….….一3

1.2研究现状……..……..…….………..………….…●一4

1.2.1情感分析研究现状….…….……..……………….~4

1.2.2弹幕文本情感分析研究现状...………一●8

1.2.3总结.......................................…........一9

1.3研究内容...….........…......……….….............一●伯

1.3.1研究的创新点.......……….….….……………..一●伯

●●竹

1.3.2论文结构….…….……………..………………一

第2章相关理论基础…..………….……………….●

文档评论(0)

qiutianfeng + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档