网站大量收购闲置独家精品文档,联系QQ:2885784924

数学模型结课论文.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数学模型结课论文

数学模型结课论文 学院: 专业: 姓名: 学号: 针对14个病毒的RNA序列建树问题 摘要 RNA病毒的发现改变了人们对RNA的认识,它具有完成各种不同功能的能力。RNA既可以作为遗传物质被一代又一代的传下去,又可以像蛋白酶一样催化生物反应的进行。而蛋白质的组装器核糖体本身就是一个RNA与蛋白质形成的复合物。因此,对RNA的研究成为分子生物学界的研究热点,本文选取了14个病毒RNA二级结构,它们是:Halobacterium sp.,Pyrodictium occultum,Suifolobus sp.,Actinia equina,Planocera reticulata,Chrysaora quinquecirrba,Diatoma tenue,Christiansenia pallida,Basidiobolus magnus,Filobasidiella depauperata,Linderina macrospora,Hydrurus foetidus,Saprolegnia ferax,Pythium hydnosporum. Lempel-Ziv是一种序列压缩算法,常被广泛的应用于生物序列的进化树构建中。本文采用LZ算法的数学思想,选取关键字k,求出RNA序列的k字子串个数并与该RNA序列的碱基个数做商,从而生成频率向量。而在这里有14条RNA序列,可以生成一个距离矩阵并求出基于条件LZ复杂度的序列间距离,通过MATLAB软件刻画1这14个病毒的进化树,从而粗略的比较RNA二级结构。将本文做出的结果与经典结果进行对比,发现大体上一致,所以本文具有一定的可行性。 关键字:RNA序列 LZ算法 距离矩阵 进化树 MATLAB 问题重述 RNA分子功能多样化,它不仅携带遗传信息,还发现它具有进化信息。由于RNA二级结构比以及序列更具有保守性,从而选取14种病毒的RNA数据,它们的RNA链链长是120个碱基左右。这些RNA二级结构之间的差异很小,对应的RNA编码序列之间的差异也不大,从而试着采取数学方法来反映出它们的进化关系。 模型假设 所有采集数据均真实有效,不考虑数据在测量时产生的系统误差K S的字汇或k-字 S的子串 子串的频数 子串的频率 母串的长度或RNA碱基个数 频率向量 第条RNA序列的频率向量 RNA链个数 子串个数 距离矩阵中的元素 距离矩阵 问题分析 RNA二级结构由多种结构元素组成,其中假结结构是一种极其重要的结构,它能影响RNA分子的功能,当形成RNA二级结构的链很长的时候,链上的碱基配对情况一般很复杂,致使相应的RNA二级结构难于处理,尤其是包含假结的二级结构。在这部分我们把假结结构看作二级结构的特殊组成元素。我们希望使用某种表示方式,使得能够保留尽可能多的信息,构建进化树。构建进化树的方法主要有:距离法、最大简约法、最大似然法贝叶斯法等,本文采取距离法,依据一定的原则及算法构建系统发生树。主要思路是根据RNA序列,选取关键字,列出所有可能的序列对,计算序列之间的遗传距离,选出相似程度较大或非常相关的序列对,利用遗传距离预测进化关系。 模型的建立与求解 4.1模型的建立 在这里采用LZ算法,将一个RNA序列看成集合S,S可以根据k-字生成对应的子串: 其中k称为S的字汇或k-字。 再将每个子串在对应母串中出现的频数写成: 为了求出RNA序列的k字子串的频率,可以将对应频数与对应母串碱基个数做比: 从而生成频率向量: T=[] 而在这里有14条RNA序列,可以生成14个频率向量: 通过求向量的最大特征值来确定距离矩阵的元素: 故有刻画向量之间关系的距离矩阵: 并求出基于条件LZ复杂度的序列间距离,从而刻画出进化树。 4.2模型的求解 根据算法,利用MATLAB程序可以进行求解(程序见附录),本文取1-字、2-字、3字,运行程序,结果分别见图1、图2、图3。 图1:1-字对应的进化树 图2:2-字对应的进化树 图3:3-字对应的进化树 根据以上进化树可以看出,随着k-字的增加,得到的结果渐趋于精确。本文选取3-字的进化树进行分析。图3中Halobacterium sp.,Pyrodictium occultum和Sulfolobus sp.被聚类在一起,并且他们明显和其它物种分开,这与它们同属于Archaebacteria的事实相符,从而可见此方法有一定的可行性;属于Stramenopiles的Saprolegnia ferax和Pythium hydnosporum被聚

文档评论(0)

haihang2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档