- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
基于情感分析和Transformer的谣言检测研究的国内外文献综述
目录
TOC\o1-2\h\u9948基于情感分析和Transformer的谣言检测研究的国内外文献综述 1
150731.1引言 1
215601.2基于传统机器学习的谣言检测 2
249411.1.1基于文本内容的谣言检测 2
250431.1.2基于用户行为的谣言检测 3
34601.1.3基于时间序列的谣言检测 3
217531.1.4基于传播模型的谣言检测 4
275031.3基于深度神经网络模型的谣言检测 5
154161.3.1基于循环神经网络模型的谣言检测 5
156931.3.2基于卷积神经网络模型的谣言检测 5
40841.3.3结合卷积神经网络和循环神经网络模型的谣言检测 6
178551.3.4基于生成对抗网络的谣言检测 6
196601.4研究现状总结 6
26954参考文献 7
1.1引言
谣言是一种特殊的社会现象,它已伴随了人类社会千余年,有学者认为谣言与人类的集体记忆和社会情形相关。我们无法预测谣言的发生和结束,它具有偶然性和突发性。一直以来,国内外许多专家学者对谣言的产生、特性以及传播方式做了大量的研究,在心理学、社会学等多个领域中,对谣言的定义都是不同的,目前,关于“谣言”,并没有一个明确的概念。
谣言是通过刻意歪曲、虚构或编造某一事实所产生一种与事实不符的信息,百度百科[2]将“谣言”定义为没有相应事实基础,却被捏造出来并通过一定手段推动传播的言论,另一种说法[49]将谣言定义为一种非正式官方的、在某一范围、某一特定人群和某一时期内传播的包含虚假成分的信息。由此可以看出,谣言可能是完全没有事实依据凭空产生的,也可能包含一定的真实成分,并非完全虚假。
由于互联网的迅速发展,现代谣言并不在局限于一定区域、一定人群和一定时期内传播,网络谣言的传播范围广,传播速度快,传播途径多,传播时间长,且具有反复性。本文中所讨论的谣言是指那些没有真实凭证、刻意捏造的或者有部分事实依据,却被造谣者故意夸大扭曲的、偏离了事实真相的消息。
谣言检测的目的在于能够及时有效的发现谣言并遏制其传播,降低谣言造成的社会危害和不良影响。当前许多社交平台针对谣言的检测方法依赖于用户的揭发检举和相关专家或官方部门的证实,然而这种方法效率低下,无法实现谣言实时检测。因此,一种自动识别谣言的方法成为了近几年研究的热门方向。
针对社交网络中的谣言泛滥问题,学术界进行了大量的研究与探索,大多数研究者将谣言检测看作一个二分类问题,目前谣言检测包括两个发展阶段:早期基于传统机器学习的谣言检测和基于深度神经网络模型的谣言检测。
1.2基于传统机器学习的谣言检测
早期的谣言检测工作主要侧重于从文本内容、用户行为、时间序列和传播结构中提取谣言特征,用有监督的方式从标记数据中训练分类器,该方法重点在于选取具有高区分度的谣言特征,因此基于传统机器学习的谣言检测方法可按谣言的特征将其分为以下四类:基于文本内容的谣言检测、基于用户行为的谣言检测、基于时间序列的谣言检测和基于传播模型的谣言检测。
1.1.1基于文本内容的谣言检测
基于文本内容的谣言检测方法主要利用该事件的文字描述信息,从中提取文本内容特征,用于训练谣言分类器。其中文本内容特征主要包括词汇特征(Lexicalfeatures)、语法特征(Grammaticalfeatures)、句法特征(Syntacticfeatures)、语义特征(Semanticfeatures)和主题特征(Themefeatures)。
Qazvinia等人[3]选取了句法特征和词汇特征来检测谣言,使用词袋模型提取了文本词汇的一元词汇特征和二元词汇特征,进一步提取了文本词汇的一元词性特征和二元词性特征,通过对收集到的数据进行分类标注,验证了浅层文本内容特征和微博元素特征在谣言检测中的区分度和有效性,通过集成分类器和贝叶斯分类器输出Twitter数据的类别。Gayo-Avello等人[4]和Castillo等人[5]认为虚假信息与真实信息在内容模式上存在不同,大多数谣言是被编造出来的,其目的在于误导民众,为更好地吸引公众注意在内容模式上具有极强的夸张性,与真实信息相比,谣言文本的长度普遍较短。Castillo等人[5]基于Twitter数据,针对谣言的内容模式,提取了内容、用户、话题和传播四类特征共68个,选取了其中最具区分度的15个特征,并构建的J48决策树对Twitter平台上特定的新闻主题信息的真实度进行了评估,最终识别准确率达到了86%。
除了词汇特征或语义特征外,一些研究者提出了另外可以反映谣言文本内容特性的主题特
您可能关注的文档
- 2025《AD公募REIT管理模式分析综述》2100字.docx
- 2025《知假买假行为问题研究背景及研究意义综述》1800字.docx
- 2025《食品安全领域知假买假行为概述综述》1300字.docx
- 2025《社会工作介入昆山市S镇农村留守老人互助养老问题研究》开题报告2400字.docx
- 2025《银行债券投资业务研究的国内外文献综述》1900字.docx
- 2025《知假买假行为问题研究的国内外文献综述》1700字.docx
- 2025《包钢集团财务工作的研习报告》3100字.docx
- 2025《国外金融科技监管分析综述》2000字.docx
- 2025《帮助信息网络犯罪活动罪的立法现状综述》2500字.docx
- 2025《中国数字音乐著作权集体管理制度陷入“信任获取”困境的原因综述》2800字.docx
最近下载
- 年产5000吨虾滑工厂设计.docx
- 5.2薪火相传有继承+课件-2024-2025学年高中政治统编版选择性二法律与生活.pptx VIP
- HJ 847-2017 排污许可证申请与核发技术规范 水泥工业.pdf
- 【川味火锅底料的生产工艺及工厂设计(附图)11000字】.docx
- 2023中国跨境出口电商行业蓝皮书.pdf
- 焚烧炉OG200CS.pdf
- 1.3信息系统应用 课件:高中信息技术必修二《信息系统与社会》.pptx VIP
- 附录B-回弹法检测泵送混凝土测区强度换算表.xls VIP
- 轴套类零件加工工艺及编程.doc
- 2022年人教版八年级数学下册第19章《一次函数》竞赛题(配套练习(附答案).docx
文档评论(0)