人类基因组计划与生物信息学之间的关系.docx

人类基因组计划与生物信息学之间的关系.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人类基因组计划与生物信息学之间的关系

人类基因组计划与生物信息学之间的关系摘要:生物信息学是20世纪80年代末随着人类基因组计划启动而兴起的一门新的交叉学科。本文回顾了人类基因组计划与生物信息学的发展过程,梳理了两者之间的关系。1 人类基因组计划人类基因组计划(Human Genome Project,HGP)由美国科学家Rena to Dulbecco于1986年率先提出,旨在阐明人类基因组3×109核苷酸序列,破译人类全部遗传信息,使得人类第一次在分子水平上全面认识自我。人类基因组研究的主要任务有两个:(1)“读出”人类基因组全部ATCG语言,即全基因组核苷酸顺序测定;(2)“读懂”人类基因组全部ATCG语言,即人类全部基因的编码及功能的研究[1]。1990年美国首先正式启动“人类基因组计划”(HGP),决定在15年内提供30亿美元的资助,完成人类全部DNA分子核苷酸序列的测定。随后,英国、法国、日本、加拿大、前苏联、中国等许多国家积极响应。1993年马里兰州Hunt Valley 会议上经美国人类基因组研究中心(CHGR)修订后的HGP内容包括:人类基因组作图(遗传图谱、物理图谱)及序列分析;基因的鉴定;基因组研究技术的建立、创新与改进;模式生物(主要包括大肠杆菌、酵母、果蝇、线虫、小鼠、水稻、拟南芥等)基因组的作图和测序;信息系统的建立,信息的储存、处理及相应的软件开发;与人类基因组相关的伦理、法律和社会问题的研究;研究人员的培训;技术转让及产业开发;研究计划的外延等几方面。HGP计划前5年的重点是制作遗传图谱和物理图谱,在此过程中不断发展出新的作图、DNA测序、基因鉴定等实验技术,使研究速度不断加快[2]。随之而来的是信息的爆炸性增长,迫切需要对海量生物信息进行处理。2001年的春天,科学家公布了人类基因组的绝大部分序列。即:人类基因组的工作草图,这意味着基因组的研究进入信息提取和数据分析的崭新阶段。根据国际数据库的统计1999年12月DNA碱基数目为30亿,2000年4月DNA碱基数目是60亿,大约每14个月翻一番。面对如此庞大的数据量,只有通过计算机才能够有效地管理和运行。基因组研究最终是要把生物学问题转化成对数字符号的处理问题,要解决这样的问题就必须发展新的分析理论、方法、技术、工具和依赖计算机的信息处理[3]。2 生物信息学主要研究内容生物信息学是本世纪80年代末开始随着基因组测序数据迅猛增加而逐渐兴起的一门新兴学科领域,它的核心是基因组信息学。基因组信息学作为一个学科领域,包括基因组信息的获取、处理、存储、分配、分析和解释。基因组信息学的关键是“读懂”人类基因组的核苷酸顺序,即全部基因在染色体上的确切位置及各DNA 片段的功能[4]。它的内涵包括:①要发展有效的能支持大尺度数据需要的软件和数据库;②需产生若干数据库工具,包括电子网络等远程通讯工具,能容易地处理日益增长的物理图、遗传图、染色体图和序列信息,并在这些数据资料中进行比较。③要研究算法和分析技术, 用于解释基因组信息,例如预测功能基因等。不言而喻,与之相应的计算很多都是大规模的,有些甚至需要发展新一代巨型机才能完成[5]。生物信息学的另一个重要任务是进行蛋白质、RNA等的结构模拟和分子设计以及随之而来的药物设计。它是一门以知识为基础的学科, 关键资源是知识,关键技术是信息处理。这门新兴学科是由生物学、数学、物理学、化学和计算机科学诸学科交叉发展而成的崭新学科, 是揭示人类及重要动植物种类的基因组信息继而进行生物大分子结构模拟和药物设计的基础, 为天然生物大分子的改性和基于受体结构的药物分子设计提供依据。它不仅对认识生物体和生物信息的起源、遗传、发育与进化的本质具有重要意义, 而且可为人类疾病的诊断和防治开辟全新的途径,还可为动植物的物种改良提供坚实的理论基础。通过对影响药物代谢或效应通路有关基因的编码序列的再测序, 有可能揭示个体对药物反应差别的遗传学基础[6]。2.1序列比对(Alignment)。基本问题是比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础, 非常重要。两个序列的比对有较成熟的动态规划算法,以及在此基础上编写的比对软件包——BLAST和FASTA,可以免费下载使用。这些软件在数据库查询和有哪些信誉好的足球投注网站中有重要的应用。有时两个序列总体并不很相似,但某些局部片段相似性较高。Smith -Waterman算法是解决局部比对的好算法,缺点是速度较慢。两个以上序列的多重序列比对目前还缺乏快速而又十分有效的算法。多重序列对比是指三个以上序列的相似度比较。多重序列对比方法与寻找基因序列的功能区密切相关, 其目的是为了揭示一族功能或进化上相关的序列间的结构相似性。一级多个序列间的相似性在序列的成对比较中通常无法表现出来。一般来说,把两个序列的比较方法用于几个序列的比较也

文档评论(0)

haihang2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档