基于深度学习的主题分类及细粒度情感分析方法研究.pdf

基于深度学习的主题分类及细粒度情感分析方法研究.pdf

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
重庆大学硕士学位论文 中文摘要 摘 要 随着微信、微博、电商等网络平台的发展,民众、企业以及政府越来越倾向于 将重要的文本信息发表在互联网上,挖掘这些文本蕴含的信息,无论对商家还是 学者都有重要的意义。细粒度情感作为文本内容的一种隐含信息,反映出用户自 身情绪和特定主题喜好程度,也包含热门话题和社会情况。该应用领域在建立评 价体系、获取实时热点、控制网络舆论等方面上存在巨大的研究价值。 细粒度情感分析是一种多标签主题预测与多分类情感预测相结合的多任务问 题,它需要对研究的文本先建立主题,再为主题建立多个情感属性。深度学习技 术在文本细粒度分析上存在样本数量少,多任务计算量大,语义信息不全等问题。 对此,本课题以经典神经网络模型为基础,从多权值输入、组合网络模型和优化 手段三个方面改进研究方案,实现深度学习技术在细粒度情感分析上的应用。主 要工作如下: 针对汽车数据集,提出一种基于Softmax 回归的多权值模型。该模型中从文本 和数据的特殊性分析了文本特征及组合方式对主题分类产生的影响,通过扩充文 本内容、修改TF-IDF 公式和添加方差加权获得增强后的文本信息,最后使用构建 的浅层神经网络来识别文本的主题。实验结果表明模型分类的准确性优于传统的 加权Word2vec 模型 1.8%,主题预测F 1 准确率为64.5% 。 分析了几种经典神经网络在细粒度分类上存在的问题,提出了一种组合神经网 络的方案扩充主题分类中使用的模型。①为避免主题分类错分的样本对情感分类 的影响,提出了主题-情感结合的标签表示法。②针对多权值方法在网络输入层存 在的语义丢失的问题,改进了第一层网络的输入加权方式。③在实验过程中,通 过调整数据增强方案解决了数据样本过少的问题。实验结果表明该模型能有效地 对汽车评论文本进行细粒度情感分析。 关键词:细粒度情感分析;Softmax;Word2Vec ;BiLSTM ;TextCNN I 重庆大学硕士学位论文 英文摘要 ABSTRACT With the development of network platforms, such as WeChat, Weibo, e-commerce, , individuals, companies and governments are increasingly inclined to publish important text information on the Internet. It is of great significance for both business and scholars to decipher the information containing in these texts. Fine-grained Sentiment, as an implicit piece of textual content, reflects the users own emotions or their preferences for a particular topic. Accordingly, hot topics and social situations can be demonstrated clearly. Fine-grained Sentiment Analysis has great value in establishing evaluation system, obtaining real-time hotspots, controlling network public opinion and many other network information researches. Fine-grained sentiment analysi

文档评论(0)

136****6583 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档