情感分析的基础知识介绍.pdfVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

情感分析的基础知识介绍

1、什么是情感分析?

情感分析是指通过文本来挖掘人们对于产品、服务、组织、个人、事件等的观点、

情感倾向、态度等。情感分析是随着互联网发展而产生的,早期主要用于对网上销

售商品的用户评语的分析,以便判断用户对其所购商品是“喜欢”还是“不喜欢”。后期

随着自媒体的流行,情感分析技术更多地用于识别话题发起者、参与者的情感趋

向,从中判断或挖掘话题中的价值,由此来分析相关舆情。情感分析的应用十分广

泛,其研究领域涉及自然语言处理、信息检索、机器学习、人工智能等。

2、文本情感分析存在的问题和挑战有哪些?

(1)领域依赖

是指文本情感分析的模型对某一领域的文本数据非常有效,但是将其应用于其他领

域的时候,会使得分类模型的性能严重下降。

(2)情感语义理解

由于自然语言情感表达的复杂性,使得计算机能够精确理解文本中的情感语义,就

必须借助自然语言理解技术,难度较大。

(3)特征提取

现有的文本情感分析使用的提取特征的方法能达到的精度还有限,如何有效地表达

语句作者情感的特征,是尚待研究的。

(4)样本标注

虽然针对产品评论的情感分析,可以通过用户对该产品的打分来进行标注,但是绝

大部分情感分析领域,有监督的机器学习情感分析方法,无法在训练阶段或者精确

的标注样本,而人工进行标注的话,则非常困难,因此样本标注也是一个待解决的

挑战。

3、情感分析的粒度是怎样划分的?

(1)文档级情感分析

是指以文档为单位进行分类,该分析是将整个文档看作一个整体来进行情感分类,

并判断该文档表达的是正面的、中立的还是负面的情感。

(2)句子级情感分析

是指以句子为单位进行分类,判断一个句子所表达的情感是正面的、中立的还是负

面的。句子级情感分析和句子的主客观判断有非常大的联系。句子的主客观判断的

目的是区分一个句子是主观句还是客观句,但并不是只有主观句才表达观点或者看

法,客观句里有时也隐藏着情感。

(3)方面级情感分析

早期也叫作特征级情感分析,它首先识别出观点的目标(通常是一个实体),然后

将其分成几个方面,挖掘出人们在不同方面对该实体的情感喜好。

4、情感分析的任务有哪些?

(1)任务一:观点目标实体和目标方面的抽取;

(2)任务二:观点持有者的抽取;

(3)任务三:观点上下文的抽取;

(4)任务四:观点情感倾向分析。

5、什么是文档级情感分析?

(1)问题定义

给定一个针对某实体e进行评论的文档d,识别出d所表达的针对e的情感s,假设

每个文档只对单个实体发表评论。

(2)有监督的文档级情感分析

由于文档级情感分析本质上是一个文本分类问题,因此现有的任何有监督的学习方

法都可以使用。在使用的时候要注意特征的提取,常用的特征包括“词及其频率”、

“词性”、“情感词和情感短语”。

(3)无监督的文档级情感分析

主要包括两种方法,一是基于某些固定的句法格式对文本进行观点挖掘;二是基于

词典模型对文本进行观点挖掘,该词典中记录了情感词和短语,以及与它们相关的

情感倾向等信息,这些信息被当做计算每一个文档的情感得分的基础。

6、什么是句子级情感分析?

(1)问题定义

假定一句话通常只包含一条意见,常将句子级情感分析看成一个三元或二元的分类

问题,针对该句子识别其情感或包含的观点。

(2)主观性分类

其主要任务是将句子分为客观句或主观句,客观句通常包含了一些事实信息,而主

观句则通常表达了个人的观点或意见。很多主观性分类的方法基于有监督学习,还

有一些方法着重从一些特殊的特征角度去考察句子的主客观性(如从标点符号、人

称代词、数字等角度出发),此外也有一些方法采用基于图的分类法完成句子的主

观性分类。

(3)句子情感分析

如果一个句子已经被确定为主观句,则需要进一步确定它蕴含的的情感倾向。目前

常用的方法包括两种,一是基于情感词典的方法(是一种无监督的方法,主要依靠

一些已有的情感词典或领域词典,以及主观文本中带有情感极性的短语来判断句子

的情感);二是基于机器学习的方法(通过选取有效的特征来完成分类任务)。

【注】:相比于基于机器学习的方法,基于情感词典的方法比较简单且符合直觉。

而基于机器学习的方法的研究重点主要在于如何发现有效特征,以及如何进行特征

选择和特征融合。

(4)处理特殊句

对于条件句、疑问句这种非普通句需要使用特殊的情感分析方法进行。

(5)处理讽刺句

常使用类似于半监督学习的方法。

7、什么是方面级情感分析?

(1)问题定义

已知一个针对实体e的综合评论,通过将这个评论分解到该实体不同

您可能关注的文档

文档评论(0)

185****0262 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档