重要药物-疾病互作网络的数据挖掘方法研究.pdf

重要药物-疾病互作网络的数据挖掘方法研究.pdf

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
优秀博硕毕业论文,完美PDF内部资料、支持编辑复制,值得参考!!!(仅供学术交流参考用)

摘 要 生物信息学是一门新兴的前沿交叉学科,它的研究焦点主要集中于使用统计 学和计算机科学工具,分析和解释海量分子生物学数据信息。作为计算机科学的 研究工作者,本文充分利用计算机科学在信息处理上的优势,使用数据挖掘的方 法对大量的生物信息数据进行分析和处理。本文结合机器学习的方法,对药物疾 病关系网络以及与其相关的受体配体关系网络和蛋白质相互作用网络中的数据 进行了挖掘和预测。本文的主要工作如下: 1. 本文充分利用受体和受体,以及配体和配体之间的相似性构造出估值矩 阵。本文以估值矩阵为依据对样本进行训练,充分利用了已知的受体配体相互作 用信息。这样在应用拉普拉斯最小二乘法的时候,可以对受体和配体之间的关系 给予一个预估的分值,从而使得在半监督学习的过程中有更多可以参考的信息。 这在训练过程中极大地提升了预测的可靠性和精确度。与以前的方法进行相比, 可以看到本文取得的结果更好。本文称这种基于改进的拉普拉斯 RLS 方法预测 受体和配体相互作用的过程为Est-LapRLS 方法。 2. 本文提出了计算蛋白质-蛋白质相互作用网络中蛋白质之间全局相关性 的方法。然后利用两个蛋白质之间的最短路径信息,通过 RLS 方法预测新的蛋 白质-蛋白质相互作用。本文不仅使用了蛋白质-蛋白质相互作用网络中最短路径 的边数来衡量两个蛋白质之间的关系,而且通过使用蛋白质之间的全局相关性对 蛋白质相互作用网络进行加权,得到了蛋白质之间的加权最短路径。使用两个蛋 白质之间的加权最短路径的权值来衡量蛋白质之间的关系,更加充分的挖掘了蛋 白质相互作用网络和蛋白质相似性网络中的已知信息。 3. 本文计算了所有药物疾病对在药物疾病网络中的每个节点上的相关度得 分,然后基于这些相关度得分构建了每个药物疾病对的相关度向量。之后本文通 过未知药物疾病对与所有已知的药物疾病对的相关度向量之间的相似性,构造了 每个药物疾病对的特征向量。最后,本文基于局部与全局一致性方法将预测药物 疾病相互关系的问题转化为标签分类问题,并且利用机器学习的方法进行处理。 本文将前面工作中预测出的受体-配体相互作用和蛋白质相互作用关系加入药物 疾病网络,从而得到一个信息更加全面、可靠的药物疾病网络。 关键词:数据挖掘,估值矩阵,全局相关性,药物疾病网络,特征向量 I Abstract Bioinformatics is a new cross disciplinary science which mainly focus on the analysis and interpretation of massive molecular biological data by using the tools of statistics and computer science. As researchers of computer science, we make full use of the advantages of computer science in information processing, using data mining methods to analyze and process the bioinformatics data. In this paper, we combined with machine learning approaches to mine and predict the information in drug-disease network 、ligand-receptor network and protein-protein interactions network. The main work of this paper are as follows: 1. We made full use of the similarities between the receptors and receptors 、 ligands and ligands to construct the estimated value matrix. We trained the sa

文档评论(0)

文献大师 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档