- 1、本文档共58页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
摘要
当前是信息大爆炸的时代,人们每天产生大量的数据,同时也被各种大数据
包围,被动接收大量信息。尤其是第四代通信技术(4G)的普及以及第五代通信
技术(5G)的推广,更是带来大量的数据,同时也使得视频可以在网络上被更加
通畅的传输,更加便捷的被人们所观看。由于人们对视频进行实时评论的需求越
来越旺盛,所以弹幕技术在视频领域逐渐普及。随着使用弹幕的人越来越多,对
视频弹幕进行情感分析的研究就显得尤为重要。研究不仅能帮助用户更好的了解
视频,也能帮助网络对于舆论进行更好的监督管理,使互联网环境更加美好。
本文首先使用网络爬虫技术,爬取了哔哩哔哩网站全部电视剧的弹幕数据;
然后并通过图表的形式对弹幕数据总体情况进行了详细说明;最后通过分层抽样
的方式挑选部分弹幕数据进行数据情感标注,然后将数据分为训练集、验证集以
及测试集,进行后续模型的训练。
本文主要采用BERT模型对于弹幕情感进行建模,从而获得对于弹幕文本情
感分析的模型。不同于大多数情感分析最终得到两种分类结果,本文最终得到三
种分类结果,即无情感倾向、积极情感倾向以及消极情感倾向。在获得模型
l值的获取方
Accuracy指标的基础上,增加了对于多分类模型Precision、Recall和F
法的分析。同时对比了在不同参数组合下,最终模型的结果。然后对测试集数据
情感分析结果进行分析,对不同类型的错误做出说明,并提出解决办法。之后分
别使用朴素贝叶斯模型和随机森林模型对弹幕数据进行情感分析建模,并将两种
模型结果与BERT模型的结果进行了对比,经过对比发现,BERT模型相比朴素贝
叶斯模型和随机森林模型用拥有更高的准确率。
最后使用BERT训练出来的情感分析模型,对电视剧进行情感分析。最终情
感分析模型结果完美的的契合了剧情,在剧情高潮时,积极情感倾向的弹幕数量
远高于消极情感倾向数量;在反派嚣张的时候,消极情感倾向的弹幕数量激增,
积极情感倾向弹幕数据骤减。
关键词:弹幕;情感分析;BERT
V
目录
第1章绪论………….…………。.●●.●●,
1.1研究背景与意义…….………….……一,
1.1.1研究背景….…….…………….……….….…..一,
1.1.2研究意义….…….………….….一3
1.2研究现状……..……..…….………..………….…●一4
1.2.1情感分析研究现状….…….……..……………….~4
1.2.2弹幕文本情感分析研究现状...………一●8
1.2.3总结.......................................…........一9
1.3研究内容...….........…......……….….............一●伯
1.3.1研究的创新点.......……….….….……………..一●伯
●●竹
1.3.2论文结构….…….……………..………………一
第2章相关理论基础…..………….……………….●
您可能关注的文档
- 基于SFIC模型的城市社区公共安全协同治+理题研究--以兰州市L社区为例.pdf
- 基于UbD理论的中职涉农课程中的教学设计与应用研究——以《植物生产与环境》中“植物的生长发育”为例.pdf
- 基于不同工业门类的黄河流域碳排放估算.pdf
- 基于多种群进化策略的卷积神经网络自动架构设计.pdf
- 基于分层叠加技术的6G物联网系统信息新鲜度研究.pdf
- 基于广义可加模型的PM2.5浓度组合预测方法.pdf
- 基于国家中小学智慧教育平台的教师家庭教育指导策略研究.pdf
- 基于国家中小学智慧教育平台的乡村教师校本研修模式构建研究.pdf
- 基于加权混合专家模型的费率厘定系统.pdf
- 基于经济领域知识融合的主观性回答生成研究.pdf
文档评论(0)