网站大量收购闲置独家精品文档,联系QQ:2885784924

基于多特征融合的关键短语提取方法研究.pdf

基于多特征融合的关键短语提取方法研究.pdf

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

目录

摘要I

AbstractIII

第一章绪论1

1.1研究背景和意义1

1.2研究现状及分析2

1.2.1有监督关键短语提取2

1.2.2无监督关键短语提取3

1.2.3面临的挑战4

1.3研究内容5

1.4本文组织结构6

第二章关键短语提取相关技术8

2.1关键短语提取及其经典模型8

2.1.1关键短语提取步骤8

2.1.2关键短语提取模型简介9

2.2深度学习相关技术10

2.2.1多层前馈神经网络10

2.2.2循环神经网络11

2.2.3长短期记忆网络12

2.2.4双向长短期记忆网络13

2.3注意力机制13

2.3.1标准的注意力机制14

2.3.2自注意力机制14

2.3.3多头注意力机制15

2.4词向量模型15

2.4.1ELMo模型16

2.4.2BERT模型17

2.4.3SBERT模型18

2.5关键短语提取常用评价指标18

2.6本章小结19

第三章基于多种信息相互制约的关键短语提取方法20

3.1研究动机20

3.1.1关键短语提取方法的思想及不足20

3.1.2解决策略21

3.2候选关键短语重要性评估标准优化设计24

3.2.1候选关键短语的提取方法设计24

3.2.2属性信息得分设计25

3.2.3局部信息得分设计27

3.2.4全局信息分数得分设计28

3.2.5关键短语的提取30

3.3实验30

3.3.1数据集30

3.3.2比较方法31

3.3.3评价指标32

3.3.4参数设置32

3.3.5实验结果34

3.3.6实验分析34

3.4本章小结38

第四章基于候选关键短语间关系的关键短语提取优化方法39

4.1研究动机39

4.1.1关键短语提取的基本思想及不足39

4.1.2解决策略39

4.2整体结构40

4.2.1预处理模块41

4.2.2奖励模块43

4.2.3惩罚模块44

4.2.4分数更新和关键短语提取45

4.3实验45

4.3.1数据集45

4.3.2实验细节45

4.3.3比较方法46

4.3.4实验分析46

4.3.5消融实验47

4.3.6参数实验48

4.4本章小结49

第五章总结与展望51

5.1本文工作总结51

5.2工作展望52

参考文献53

攻读硕士学位期间的主要研究成果58

致谢59

摘要

随着信息技术的不断发展,大数据所呈现的庞大数据量和低价值密度特征日益显著,

这一趋势导致了提取有效信息变得更加困难。关键短语提取技术可以从指定文本中抽取

与文本内容高度相关的重要短语,以帮助读者迅速领会文本的主要内容。因此,关键短

语提

文档评论(0)

论文资源 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档