否定信息识别研究.pdf

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
重庆大学硕士学位论文 中文摘要 摘 要 否定是存在于所有语言中一种复杂的语言现象,能对句子或词语包含的语义 信息进行反转。越来越多的自然语言处理任务需要从文本信息中挖掘出有价值的 信息,否定的存在将会导致挖掘到无用甚至完全相反含义的信息,对任务的性能 产生消极影响。因此,需要对否定信息进行识别,将文本信息中肯定信息与否定 信息分离,并进一步识别出否定的作用范围,从而获得句子表达的正确含义,同 时也能提升情感分析、信息检索、信息抽取等任务的性能。 本文主要围绕汉语和英语的否定触发词识别任务、否定覆盖域识别展开了以 下工作: 1)使用双向长短期记忆网络结合条件随机场为模型对汉语和英语分别进行否 定触发词识别和否定覆盖域识别。该模型能够克服条件随机场严重依赖人工提取 特征的缺点和双向长短期记忆网络没有从全局考虑标签序列的缺点,仅以预训练 的词向量作为输入进行否定触发词识别,在此基础上添加标准触发词特征进行否 定覆盖域识别。实验证明:在汉语和英语语料上,基于该模型的否定触发词识别 和否定覆盖域识别都获得了较好的实验结果,并且该模型在英语语料的生物医学 领域不同文本之间具有较强的泛化能力。 2 )融合自注意力机制进行否定覆盖域识别。针对否定覆盖域较长时难以识别 完整的问题,自注意力机制层通过计算句子内部任意两个词语的相似性来拉近任 意两个词语之间的距离,提升了模型学习长远上下文依赖的能力。实验结果证明, 该方法对提升否定覆盖域识别性能有重要意义。 3 )融入依存句法信息进行否定覆盖域识别。否定覆盖域是否定触发词的作用 范围,在依存句法上存在支配和被支配的关系,因此在BiLSTM-CRF 模型的基础 上,通过融入依存句法信息来拉近依存关系词语之间的距离以提升双向LSTM 层 学习长远上下文依赖关系的能力。实验结果表明,在表达较为规范的语料上,该 方法能提升否定覆盖域识别的效果。 关键词:否定触发词;否定覆盖域;BiLSTM-CRF;自注意力机制;依存句法 I 重庆大学硕士学位论文 英文摘要 Abstract Negation is a complex linguistic phenomenon that exists in all languages. It can reverse the semantic information contained in sentences or words. More and more natural language processing tasks need to mine valuable information from text information. Negation existence will lead to the mining of useless or even completely opposite information, which has a negative impact on the performance of the task. Therefore, it is necessary to identify the negative information, separate the positive information from the negative information in the text information, identify the negation scope of action. Thus obtaining the correct meaning of sentence expression and improv

文档评论(0)

136****6583 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档