基于深度学习的文本相似度算法的研究与应用.pdf

基于深度学习的文本相似度算法的研究与应用.pdf

  1. 1、本文档共72页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
重庆大学硕士学位论文 中文摘要 摘 要 随着互联网行业和深度学习技术的快速发展,自然语言处理领域取得了前所 未有的进展。自然语言推理在大数据的背景下取得了丰硕的成果,文本相似度分 析是自然语言推理中一项基本而又关键的任务,并在很多自然语言处理任务中起 着不可替代的作用,比如:信息检索、自动问答、机器翻译、自动摘要和智能客 服。提高中文文本相似度计算准确性,可以基本解决很多自然语言处理领域中文 本相关的问题,因此为了提高文本相似度算法的准确率,本文做了大量的相关工 作和研究。 本文主要研究基于深度学习的中文文本相似度算法,分别训练以词向量和字 向量为输入的中文文本相似度模型,并分析不同粒度的输入对模型的影响。 本文分析了传统的孪生 LSTM 模型的缺点,并对模型进行改进,在模型中引 入双向 LSTM ,充分利用双向 LSTM 每个时间步的信息,达到捕获文本多维度语 义信息的效果,并在模型中引入注意力机制,使句子编码所包含的语义信息更加 丰富。为了解决一词多义的问题,更好的获取句子的语义编码,本文利用迁移学 习技术,将 Bert 模型引入到文本相似度计算中,并在其基础上结合卷积神经网络 来学习句子的深度文本表示,设计并实现了基于Bert 的表征模型,并取得了非常 好的效果。 本文还实现了两个基于交互的文本相似度模型,并将其与本文训练的其他模 型进行融合。本文通过多模型融合方法达到进一步提高中文文本相似度计算准确 性的目的。 本文设计并实现基于FAQ 的智能客服系统,将本文实现的中文文本语义相似 度模型应用到系统中,系统主要涉及文本预处理和深度融合模型等关键技术。智 能客服系统主要是自动回复用户提出的受限领域相关问题。通过对系统的测试, 系统自动回复有很高的准确率,这也进一步说明了本文实现的深度学习模型和文 本相似度融合模型的有效性。 关键词:文本相似度; 深度神经网络; LSTM ;注意力机制;迁移学习 I 重庆大学硕士学位论文 英文摘要 Abstract With the rapid development of the Internet and deep learning technology, the field of natural language processing has made unprecedented progress. Natural language inference has achieved fruitful results in the age of big data. Text similarity analysis is a basic and critical task in natural language inference, and plays an irreplaceable role in many natural language processing tasks, such as: information retrieval, automatic question and answer, machine translation, automatic summarization and intelligent customer service. We can basically solve many text-related problems by improving the accuracy of Chinese text similarity calculation in the field of natural language processing. Therefore, we have done a lot of related work and research in order

文档评论(0)

136****6583 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档