- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
情感分类中基于词性嵌入的特征权重计算方法
情感分类中基于词性嵌入的特征权重计算方法
于海燕 陆慧娟 郑文斌
中国计量大学信息工程学院
X
关注成功!
加关注后您将方便地在 我的关注中得到本文献的被引频次变化的通知!
新浪微博
腾讯微博
人人网
开心网
豆瓣网
网易微博
摘????要:
在文本情感分类中, 传统的特征表达通常忽略了语言知识的重要性。提出了一种基于词性嵌入的特征权重计算方法, 通过构造一种特征嵌入模式将名词、动词、形容词、副词四种词性对情感分类的贡献度嵌入到传统的TFIDF (Term Frequency-Inverse Document Frequency) 权值中。其中, 词性的情感贡献度通过粒子群优化算法获得。实验采用支持向量机完成分类, 并对比了不同知识的嵌入情况, 包括词性、情感词及词性和情感词的组合。结果表明基于词性嵌入的方法分类性能最优, 可以显著提高中文文本情感分类的准确率。
关键词:
词性嵌入; 特征权重; 情感分类; 粒子群优化;
作者简介:于海燕 (1991—) , 女, 硕士研究生, 主要研究领域为文本情感分类;
作者简介:陆慧娟, 女, 博士, 教授;
作者简介:郑文斌, 男, 博士, 副教授, E-mail:zwb@。
收稿日期:2016-05-24
基金:国家自然科学基金 (No No.11391240180)
Feature weighting method based on part of speech embedding for sentiment classification
YU Haiyan LU Huijuan ZHENG Wenbin
College of Information Engineering, China Jiliang University;
Abstract:
The importance of language knowledge is always neglected in traditional feature representation for text sentiment classification. This paper proposes a novel feature weighting approach based on part of speech embedding, in which a feature embedding schema is constructed such that the contribution of noun, verb, adjective and adverb can be embedded into the traditional TF-IDF (Term Frequency-Inverse Document Frequency) weighting, where the best contribution value is obtained by particle swarm optimization algorithm. The support vector machine classifier is used for the Chinese text sentiment classification. In the experiment, the performance of different knowledge is also compared, such as part of speech, sentiment words and their combination. The experimental results show that the proposed method achieves the best classification performance.
Keyword:
part of speech embedding; feature weighting; sentiment classification; particle swarm optimization;
Received: 2016-05-24
1 引言
随着互联网的迅速发展以及网络平台的开放, 网络上出现了大量的评论文本。这些文本包含着人们的各种观点和态度。实现对文本的情感倾向性分析, 对商业决策、信息检索、信息安全等都有着重要的意义。
情感文本的特征表达是情感分类领域研究的重点问题之一[1-2]。传统的情感分类方法往往是直接从训练文本中提取特征, 并用布尔加权算法、词频特征权重算法或TF-IDF[3]权重算法等表示特征向量的权重, 却未考虑文本中所含的有利于情感分类的因素的重要性, 比如,
您可能关注的文档
- 民办高职院校学生宿舍6S管理模式探究.doc
- 面向运营管理的多粒度省际客运需求预测方法.doc
- 民国时期的电视知识生产.doc
- 面向学科领域科研数据发表的图书馆服务——以化学学科为例.doc
- 民国前期书籍封面设计家代表人物评析.doc
- 民间美术与儿童美术艺术式样比较.doc
- 民间传统手工艺传承中的隐性知识及其当代转化.doc
- 民机着陆目视判断及操作影响因素研究.doc
- 民勤绿洲畦膜上灌对玉米灌水量及产量的影响.doc
- 民族地区高中生批判性思维能力的跨文化研究.doc
- 2024年中国钽材市场调查研究报告.docx
- 2024年中国不锈钢清洗车市场调查研究报告.docx
- 2024年中国分类垃圾箱市场调查研究报告.docx
- 2024年中国水气电磁阀市场调查研究报告.docx
- 2024年中国绿藻片市场调查研究报告.docx
- 2010-2023历年初中毕业升学考试(青海西宁卷)数学(带解析).docx
- 2010-2023历年福建厦门高一下学期质量检测地理卷.docx
- 2010-2023历年初中数学单元提优测试卷公式法(带解析).docx
- 2010-2023历年初中毕业升学考试(山东德州卷)化学(带解析).docx
- 2010-2023历年初中毕业升学考试(四川省泸州卷)化学(带解析).docx
最近下载
- 2023年09月九年级数学上册-一元二次方程(有难度)专题培优训练53题【含答案】.pdf
- 小学语文_《棉花姑娘》教学设计学情分析教材分析课后反思.doc
- ctgd sop 38水泵安装作业指导书.pdf VIP
- 什么是人力资源三支柱体系.doc VIP
- YD_T 4042.4-2022 智慧化工园区大数据平台 第4部分:平台运维管理技术要求.docx
- 输电线路施工方案及技术措施.pdf VIP
- 高压架空线路安全施工方案.doc VIP
- 第二章 一元二次方程单元测试2024-2025学年北师大版数学 九年级上册 .docx
- 330kV升压站设备试验施工作业指导书.docx
- 【方案】风电场330kv升压站调试方案.docx
文档评论(0)