- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于用户与产品信息和图卷积网络的情感分类研究
摘要:在评论情感分析的研究中, 和评论相关的用户与产品信息对于提高情感分
类的准确率有很大的帮助。 为了能够有效地利用产品和用户信息, 并构建产品和
用户信息与评论之间的关联, 该文提出一种基于图网络的模型, 将产品与用户信
息和评论之间的关系构建为一个图 ,并基于图卷积网络模型学习产品与用户信息
对评论的影响, 从而提升评论情感分类的准确率。 在 Yelp2013 数据集上进行实
验,实验结果表明,该模型能有效地提高评论的情感分类准确率。
关键词:图卷积;神经网络;情感分类
引言
伴随着互联网技术的飞速发展, 形形色色的社交平台、 电商平台也在不断繁
衍,如淘宝、京东、大众点评、豆瓣、 Yelp 、Amazon 等诸多在线评论网站早已
深入我们的日常生活。 这些平台上的评论对于用户和商家都具有很重要的参考价
值 [1] ,比如,对于网络购物的消费者而言,在线评论可以帮助他们做出有效的购
买决策,进而买到心仪的产品。 而对于商家, 通过挖掘大量的评论数据来了解其
产品的用户体验, 帮助商家做出有效的商业决策, 从而带来可观的收益。 由此可
见,对在线评论的数据挖掘具有重要的应用价值。
在线评论的情感分类, 正是评论文本数据挖掘方面的一个重要任务, 其主要
目的是识别主观文本情感 [2] 。随着在线评论的数量不断增加,评论内容更是复杂
多样,想要通过人工判别的方法去一一分析每一条评论的情感几乎是不可能的,
在这个大数据时代, 我们迫切地需要一种自动判别的方法来实现在线评论的情感
分类,从而高效地帮助消费者和商家在海量评论文本中获取有价值的信息。
国内外的相关学者已经对在线评论文本的情感分类做了相关的研究, 并取得
了一些显著的成果。但是,在以往的研究中,通常把每条评论看成独立的文本,
只关注评论文本内容本身, 而忽略了用户和产品的关联影响, 实际上用户的偏好
和产品的特性对于评论的情感分类都是有一定影响的。 对于不同的用户, 表达情
感的方式也会有所差异,如个人偏好、措辞习惯、语义逻辑等方面,而这些用户
信息都会对最终的评论情感分类产生一定的影响。 另外,产品信息也会对评论的
情感分类产生一定的影响,产品的质量越高,往往评价也会越好。我们在
Yelp2013 实验数据集上抽取了一个用户发表的 1 条主评论、该用户的 2 条历史
评论,以及 2 条产品相关评论,表 1 给出了评论示例。
表 1 评论示例
从表 1 的例子可以看出, 主评论文本比较简短, 没有过多的情感修饰词, 仅
仅有一句“ so sweet ”,很容易判定为积极的情感,但是通过这位用户的两条历
史评论,我们发现“ sweet ”往往和“ don ’t like ”“hate ”这些情感词联系在
一起,由此可见该用户是不喜欢吃甜食的, 即在用户信息的辅助下, 该主评论更
倾向于负向情感;另外再来看看产品信息,从两条产品相关评论中得知这家的
Pizza 被贴上了“ not very good ”“ not recommended ”负面标签,由此可
见,这家的 Pizza 并不是很受欢迎,评价更倾向于负面情感。故综合用户信息和
产品信息,可以判断主评论实际想要表达的是不满意的情绪, 故这条主评论应该
被判定为消极。
因此,在本文的研究中, 我们不再只提取主评论本身的特征来实现评论的情
感倾向性分析, 而是引入用户和产品信息作为辅助特征, 为了能够有效地利用产
品和用户信息, 并构建用户、 产品信息与主评论之间的关联, 本文提出了一种基
于图网络的模型, 将用户与产品信息和主评论信息之间的关系构建为一个图, 并
基于图卷积网络模型学习产品与用户信息对主评论的影响, 从而提升评论情感分
类的准确率。通过设计相关实验,验证了在评论文本信息中融入用户、 产品信息,
并引入图卷积神经网络模型,对评论情感分类的准确率提升具有明显的作用。
本文后续内容安排如下:第 1 节主要介绍情感分类和基于用户与产品信息
的情感分类的相关工作; 第 2 节主要介绍模型的三个重要组成部分, 分别为基于
多文本信息的语义表示、 基于用户与产品信息的图网络构建以及图卷积模型的训
练与优化;第 3 节介绍实验数据集、 实验参数设置、评价标准、基准系统以及实
验结果分析;最后,在第 4 节中对研究工作进行总结。
相关工作
1.1 情感分类
情感分类是情感分析的任务之一, 一直以来都是自然语言处理领域的研究热
点。情感分类是指根据文本所表达的含义和情感信息将文本划分成褒扬的或贬义
的两种或几种类型, 是对文本作者倾向性、 观点和态度的划分, 因此有时也称倾
向性分析 (opinion analysis) 。情感分类的方法随着科技的进步,也在不断地演
变,从
文档评论(0)