- 1、本文档共14页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
情感隐喻语料库构建与应用
中国科学: 信息科学 2015 年 第45 卷 第12 期: 1574–1587
社会媒体处理专题 论文
情感隐喻语料库构建与应用
张冬瑜 杨亮 郑朴琪 徐博 林鸿飞*
大连理工大学信息检索研究室, 大连 116023
* 通信作者. E-mail: hflin@dlut.edu.cn
收稿日期: 2015–09–24; 接受日期: 2015–10–20; 网络出版日期: 2015–12–07
国家自然科学基金(批准号: 和辽宁省自然科学基金 (批准号: 201202031, 2014020003) 资助项目
摘要 隐喻普遍存在于人类语言中, 是对复杂而抽象的情感进行概念化的重要手段, 也是情感计算
的重要组成部分. 无论面向计算机科学还是语言学的应用, 情感计算都需要大规模、高质量的语料
库作为资源支撑, 才能进行更加深入、广泛的研究. 因此, 本文构建一个大规模汉英双语情感隐喻语
料库, 用以满足情感计算对语言资源建设的迫切需求. 首先归纳情感隐喻语料库构建的理论框架, 然
后从概念界定、设计原则、语料收集、语料标注、质量监控5 个方面分别进行说明, 最后论述了该语
料库在机器翻译、外语教学及情感分析方面的应用.
关键词 情感计算 情感隐喻语料库 机器翻译 外语教学 情感分析
1 引言
人类具有丰富而复杂的情感. 随着人工智能和互联网的发展, 特别是微博、微信、在线购物、社交
网站等网络媒介的迅速崛起, 产生了大量包含多种情感倾向的叙事或评论性信息. 人们越来越迫切地
希望计算机像人一样具备感知、理解并生成复杂情感的能力, 从而对日益庞大的海量数据所传递的情
感信息进行分析和处理. 情感计算就是赋予计算机人类所具有的情感能力, 对来源于情感或与情感相
[1]
关的信息进行计算 . 它是自然语言处理与人工智能的重要研究内容, 也是计算机语言智能向纵深发
展的关键问题之一, 具有重要的理论和实际应用价值.
情感是抽象、模糊、不易描述的, 在这种情况下, 人们常常使用生动形象的隐喻表述内心情感, 例
如: “焦头烂额” 、“心花怒放” 、“吓破胆” 、“飘飘然” 、“gust and boiling wave”、“I’m six feet off the
ground” 等. 情感隐喻作为思维方式普遍存在于人类语言中, 使用频率非常高, 日常交流中每三句话中
[2] [3]
就可能出现一次 , 人一生平均使用大约2100 多万次隐喻表达 . 隐喻是建立在人类生理体验之上
[4]
的, 是对复杂、抽象的情感进行概念化的重要手段, 是情感表达的主要方式 , 因此情感隐喻是情感计
算中不可缺少的组成部分, 具有十分重要的意义. 情感隐喻语料库是情感隐喻计算的基础, 只有在大
规模、高质量语料库的支撑下, 情感隐喻研究才能更加深入、广泛地进行. 虽然对情感隐喻语料资源
建设需求迫切, 但是目前国内外情感隐喻语料库资源比较匮乏, 因此下文从隐喻以及相关情感语义资
源这两类资源的建设研究加以回顾.
[5]
Master Metaphor List (简称MML) 是最早在概念隐喻理论指导下建立的常规隐喻语料库 . 许
多有影响力的隐喻语料资源都一定程度上借鉴了MML 的构建理论和方法. MML 语料来源于英文隐
引用格式 张冬瑜, 杨亮, 郑朴琪, 等. 情感隐喻语料库构建与应用. 中国科学: 信息科学, 2015, 45: 1574–1587, doi: 10.1360/N112015-
00242
中国科学: 信息科学 第 45 卷 第 12 期
喻书籍文献、在线论坛和学生作文中的隐喻实例. 以此为基础George Lakoff 等将隐喻分为情感
文档评论(0)