网站大量收购独家精品文档,联系QQ:2885784924

面向中药新药发现过程的文本挖掘方法研究.pdf

面向中药新药发现过程的文本挖掘方法研究.pdf

  1. 1、本文档共98页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

摘要

摘要

随着中医药现代化进展,中医药相关研究文献呈指数级增长。当前中药新药研

发存在收益与风险比低、周期漫长以及相关基础研究薄弱等问题。本文针对当前中

药新药研存在的问题,进行中药和计算机学科之间的多学科协作研究,以文本为研

究对象,计算机深度学习技术为手段,实现医药学领域文本挖掘,并且以药理文本

相似性为依据,推荐与目标药物的相似药物,以达到新药研发虚拟筛选目的。

本文以文本作为研究对象,开展中医药文本的药理作用实体识别,药物-药物

相互作用提取和基于文本相似性学习的新药发现工作,并搭建基于文本挖掘的新药

发现平台。本文工作具体如下:

1.针对当前中药药理作用数据不完整、不规范的问题以及药理研究成果多以文

献形式出现且中药药理领域未进行文本挖掘研究的现状,本文开展了中药药理作用

实体识别研究。针对目前实体识别模型未考虑中文汉字字内语义问题,构建基于笔

画的药理实体识别模型。规范构建药理实体识别语料库,在药理语料库以及

SIGHAN2006F169.86

公开语料库上对提出模型进行测试,最终模型值分别达到

和90.84。

2.本文针对当前药物和药物关系提取模型未考虑医药学领域知识的问题,提出

特征富集的药物相互作用提取模型。为引入医药学领域知识,使用在医药学领域文

本来进行词向量的预训练;针对样本特征,学习每个词在样本中对于药对的相对距

离。将CNN和RNN进行堆叠,其中CNN用于提取文本的N元语言特征,RNN

用于计算整个句子上下文特征。模型在DDIExtraction2013语料库上进行实验评估,

最终得到F1值为73.9。

3.中药新药发现能够以中药之间的药理相似性作为依据。针对当前中药新药发

现使用药理实验方式进行研究,但实验方式耗时的现状,本文提出使用药理文本相

似度来表示药理相似度。本文通过聚类算法构建药理文本相似度监督学习的语料

库,并且构建基于注意力孪生网络的文本相似度学习模型。模型在ATEC公开语料

F154.445.8

库以及构建的药理相似度学习语料库进行实验评估,值分别到达和。

4.本文设计并搭建了浏览器/服务器架构的基于文本挖掘的新药发现平台,平台

采用Java,HTML,JavaScript语言,数据库采用MySQL关系型数据库,利用

SpringBoot框架进行开发。平台包括用户管理、文献挖掘、新药发现三大功能,能

够实现对用户上传的文献进行药理实体提取、药物关系抽取以及对目标药物药理相

I

摘要

似的药物推荐。平台以文本挖掘为基础,通过文本相似度学习,为中药新药研发提

供辅助决策功能。

关键词:命名实体识别,药物相互关系提取,文本相似度计算,中药新药发现

II

ABSTRACT

ABSTRACT

Inrecentyears,withtheprogressofthemodernizationofChinesemedicine,the

researchliteratureofChinesemedicineisincreasedexponentially.Therearesome

problemsexistedinnewChinesemedicinesdevelopment,suchaslowprofit-riskratio,

longcycleandweakrelatedbasicresearch.Inviewoftheproblemsexist

文档评论(0)

论文资源 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档