基于深度表示学习的跨领域情感分析.pdfVIP

基于深度表示学习的跨领域情感分析.pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于深度表示学习的跨领域情感分析

总第7 期 2017 年 第7 期 基于深度表示学习的跨领域情感分析* 余传明 1 冯博琳 1 安 璐 2 1( 中南财经政法大学信息与安全工程学院 武汉 430073) 2(武汉大学信息管理学院 武汉 430072) 摘要: 【目的 】通过在标注资源丰富的源领域中学习, 并将目标领域的文档投影到与源领域相同的特征空间中去, 从而解决目标领域因数据量较小难以获得好的分类模型的问题。【方法 】选择亚马逊在线购物网站在书籍、DVD 和音乐类目下的中文、英文和日文评论作为实验数据, 在卷积神经网络和结构对应学习的基础上提出跨领域深 度表示模型(CDDRM), 以实现不同领域环境下的知识迁移, 并将其应用到跨领域情感分析任务之中。【结果】实 验结果表明, CDDRM 在跨领域环境下最优的F 值达到0.7368, 证明了该模型的有效性。【局限 】CDDRM 针对长 文本的跨领域情感分类F 值仍然有待提升。【结论 】知识迁移能够解决监督学习在小数据集上难以获得好的分类 效果的问题, 与传统监督学习的基本假设相比, 它并不要求训练集和测试集服从相同或相似的数据分布。 关键词: 跨领域 知识迁移 深度表示学习 情感分析 分类号: TP391 同类任务, 从而减少重新训练模型的时间和精力, 跨 1 引 言 领域迁移学习(Cross Domain Transfer Learning)成为解 随着“互联网+” 的发展与深入, 其与各行各业的 决目标领域标注资源匮乏问题的有效方式。 结合为广大互联网使用者提供了丰富的信息及服务。 2 研究背景 这些与互联网进行结合的各个领域, 都纷纷利用自然 语言处理技术(Natural Language Processing, NLP)从海 跨领域问题需要解决的难点在于不同领域之间 量文本数据中提取有价值的信息。随着对特定领域进 特征分布不同, 现有研究包括基于词典的方法、基于 行的特征或表示提取的研究不断细化, 研究者们也逐 多领域文档的方法和基于结构学习的方法等。 渐意识到: 每当处理具体任务时, 都需要重新对当前 2.1 基于词典的方法 任务中涉及到的数据进行分析, 以提取有效特征, 为 基于词典的方法通常使用一些现有词典资源缩小 此进行的一系列特征工程工作十分费时费力, 尤其是 源领域与目标领域之间的特征词项在分布上存在的差 在领域特征经常发生变化的情况下[1] 。除此之外, 在这 异。Denecke [2]将英文情感词典 SentiWordNet 用于跨 类任务中广泛使用的监督学习方法, 其分类器的效果 领域的情感分类, 该词库涵盖了较全的情感词汇, 且 受到标注数据数量和质量的影响。为了获得一个好的 领域的覆盖面较广。但存在的问题也很明显, 其方法 分类模型, 往往需要大量的高质量人工标注数据, 而 的效果受情感词典的影响较大, 且不能用于多语环 在一些情况下, 人工标注数据的获取同样十分困难。 境。为了解决这一系列的问题, Li 等[3]利用源领域信息, 为了能将现有领域训练的模型, 用于处理其他领域的 自动地从目标领域中提取情感词汇及主题信息, 一定 通讯作者: 安璐, ORCID: 0000-0002-5408-7135, E-mail: anlu2009@ 。 *本文系国家自然科学基金面上项目“大数据环境下基于领域知识获取与对齐的观点检索研究”(项目编号:、国家自然科 学基金青年项目“突发公共卫生事件社交媒体信息主题演化与影响力建模”(项目编号: 和武汉大学人文社会科学青年学者学 术发展计划学术团队项目“人机交互与协作创新”(项目编号: Whu2016020)的研究成果之一。

文档评论(0)

suijiazhuang1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档