- 1、本文档共19页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
用判别分析的方法判定DNA序列的类别_数学建模论文--第1页
用判别分析的方法判定DNA序列的类别
用判别分析的方法判定DNA序列的类别_数学建模论文--第1页
用判别分析的方法判定DNA序列的类别_数学建模论文--第2页
摘要
判别分析法是多元统计分析中的重要内容之一。
近年来,人们用判别分析的方法解决了不少在生产科
研和日常生活中的实际问题。本文用Fisher判别的思
想,从变量检验入手,给出了对DNA序列进行不同
分类的理论依据,并探讨错判概率与判别效率之间的
关系。通过对检验样本的回报情况分析可知,本文所
建立的模型分辨率高(95%),错判率低(1%),简
单而易于运行,适合于各种长度的DNA序列的分类,
因此实用性强,有较高的理论价值,为多元统计分析
方法在生物信息学领域中应用的又一典型实例。
关键词:
DNA序列、Fisher判别法、判别函
数、错判率。
一、问题提出
用判别分析的方法判定DNA序列的类别_数学建模论文--第2页
用判别分析的方法判定DNA序列的类别_数学建模论文--第3页
1.背景
人类基因组计划中的DNA全序列图是一本记录着人类自生老病死及遗传进
化的全部信息的“天书”。这本大自然写成的“天书”是由4个字符A、C、G、
T按一定的顺序排成的长约30亿的序列,其中没有断句,也没有标点符号,除
了这4个字符表示4种碱基以外,人们对它包含的内容知之甚少,难以读懂,
破译这部世界上最巨量信息的“天书”是二十世纪最重要的任务之一。在这个目
标中,研究DNA全序列具有什么结构,由这4个字符排成看似随机的序列中隐
藏着什么规律,又是解读这部天书的基础,是生物信息学最重要的课题之一。对
DNA序列的逐步认识让人们相信DNA序列中存在着局部的和全局的结构,充分
发掘序列的结构对理解DNA全序列是十分有意义的。
2.问题
有20个已知类别的人工序列:A类,B类。
1.从中提取特征,构造模型,找出合适的分类方法,并用该法对另20个
给出的未知类别的人工序列进行分类,要求详述方法及给出计算程序。
2..对另给出的182个自然序列进行分类。
二.问题的分析
本题重在从已知类别的DNA序列中提取某些特征,构造分类方法,提取的
某些特征应满足以下条件:
1)来源于已知样本。
2)具有给予未知类别的DNA序列分类的功能。
3)能较好的接受检验样本的检验。
全部地考虑各种因素(如碱基的排列组合,碱基间的键强及键长等等),无法得
到分类方法。忽略以上特征,突出A、C、G、T在DNA序列中出现的频数,对
这个特征利用多元统计分析方法可以达到要求。判别分析法对分类问题有着较强
的适合性,而在Fisher判别法,Bayes判别法,距离判别法等方法中,Fisher判
别法条件更宽、更通用。
用判别分析的方法判定DNA序列的类别_数学建模论文--第3页
用判别分析的方法判定DNA序列的类别_数学建模论文--第4页
三、符号与假设
1、主要假设
(1)分析DNA序列时,不考虑A、C、T、G出现的顺序。
(2)忽略碱基间
文档评论(0)