- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
DNA片段拼接中重复序列算法研究
计算机科学2006Voi. 33N. 7
DNA 片段拼接中重复序列算法研究*)
王 磊 张祖平 陈建二
(中南大学信息科学与工程学院 长沙4 10083 )
摘 要 本文主要研究DNA 片断拼接中重复序列信息识别算法。包含大量重复信息的DNA 序列,其重构是大规模
DNA 片段拼接所面临的实际困难之一。针对目前大多数拼接算法对于重复段的处理采用效率较低的反复迭代算法
的特点,提出了基于k-mer 子串的重复段分析方法,充分考虑了拼接中可能的分割点,设计与分析了识别重复序列并
提高序列一致性的高效算法。
关键词 生物信息学,片段拼接,重复片断,k-mer 子串
Algorithms of Repeats in DNA Fragment Assembly
WANG Lei ZHANG Zu-Ping CHEN Jian-Er
(Schooi of Information Science Engineering ,Centrai South University ,Changsha 4 10083 )
Abstract The paper mainiy studies repeats anaiysis in DNA fragment assembiy. One of the practicai difficuities that remain
in iarge-scaie DNA fragment assembiy is the correct reconstruction of DNA seguences that contain repeats. Aiming at the char-
acteristic of iterativeiy deaiing with repeats by most fragment assembiers which are very inefficient,the paper not oniy proposes
a generai method of kmer-based repeat anaiysis that fuiiy considers aii possibie break points in the assembiy ,but aiso designs
and anaiyses high-performance aigorithms to move repeats as weii as improve overaii consistency.
Keywords Bioinformatics ,Fragment assembiy ,Repeat ,k-mer substring
mer 子串快速确定重复序列的位置。这种方法适用于任何遵
! 引言
循如下几个步骤的序列拼接方法的预处理中: 比较片断集
!
为了适应复杂生物(例如人等)大规模、长片断的DNA 合中的所有片断,获得可能存在的重叠部分(Overiap ); 建
序列测定的需要,当前世界范围内的主要测序中心以及重要 立所有片断间的相互组合关系(Layout ),以片断为顶点,重叠
的测序工程都普遍采用了鸟枪(Shotgun )测
文档评论(0)