情感分类中基于词性嵌入的特征权重计算方法.docVIP

情感分类中基于词性嵌入的特征权重计算方法.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
情感分类中基于词性嵌入的特征权重计算方法

情感分类中基于词性嵌入的特征权重计算方法 于海燕 陆慧娟 郑文斌 中国计量大学信息工程学院 X 关注成功! 加关注后您将方便地在 我的关注中得到本文献的被引频次变化的通知! 新浪微博 腾讯微博 人人网 开心网 豆瓣网 网易微博 摘????要: 在文本情感分类中, 传统的特征表达通常忽略了语言知识的重要性。提出了一种基于词性嵌入的特征权重计算方法, 通过构造一种特征嵌入模式将名词、动词、形容词、副词四种词性对情感分类的贡献度嵌入到传统的TFIDF (Term Frequency-Inverse Document Frequency) 权值中。其中, 词性的情感贡献度通过粒子群优化算法获得。实验采用支持向量机完成分类, 并对比了不同知识的嵌入情况, 包括词性、情感词及词性和情感词的组合。结果表明基于词性嵌入的方法分类性能最优, 可以显著提高中文文本情感分类的准确率。 关键词: 词性嵌入; 特征权重; 情感分类; 粒子群优化; 作者简介:于海燕 (1991—) , 女, 硕士研究生, 主要研究领域为文本情感分类; 作者简介:陆慧娟, 女, 博士, 教授; 作者简介:郑文斌, 男, 博士, 副教授, E-mail:zwb@。 收稿日期:2016-05-24 基金:国家自然科学基金 (No No.11391240180) Feature weighting method based on part of speech embedding for sentiment classification YU Haiyan LU Huijuan ZHENG Wenbin College of Information Engineering, China Jiliang University; Abstract: The importance of language knowledge is always neglected in traditional feature representation for text sentiment classification. This paper proposes a novel feature weighting approach based on part of speech embedding, in which a feature embedding schema is constructed such that the contribution of noun, verb, adjective and adverb can be embedded into the traditional TF-IDF (Term Frequency-Inverse Document Frequency) weighting, where the best contribution value is obtained by particle swarm optimization algorithm. The support vector machine classifier is used for the Chinese text sentiment classification. In the experiment, the performance of different knowledge is also compared, such as part of speech, sentiment words and their combination. The experimental results show that the proposed method achieves the best classification performance. Keyword: part of speech embedding; feature weighting; sentiment classification; particle swarm optimization; Received: 2016-05-24 1 引言 随着互联网的迅速发展以及网络平台的开放, 网络上出现了大量的评论文本。这些文本包含着人们的各种观点和态度。实现对文本的情感倾向性分析, 对商业决策、信息检索、信息安全等都有着重要的意义。 情感文本的特征表达是情感分类领域研究的重点问题之一[1-2]。传统的情感分类方法往往是直接从训练文本中提取特征, 并用布尔加权算法、词频特征权重算法或TF-IDF[3]权重算法等表示特征向量的权重, 却未考虑文本中所含的有利于情感分类的因素的重要性, 比如,

文档评论(0)

zijingling + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档