Lect04(北大计算生物学-计算生物学基本问题).pdf

Lect04(北大计算生物学-计算生物学基本问题).pdf

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Lect04(北大计算生物学-计算生物学基本问题)

第第 章章 第第四四章章 计算生物学基本问题计算生物学基本问题 计算生物学基本问题计算生物学基本问题 高通量数据下的计算生物学高通量数据下的计算生物学 重大转变重大转变:从基于传统基因组测序数据分析转向新一代基 因组测序数据分析因组测序数据分析,,转向对大规模基因组转向对大规模基因组表达的分析表达的分析,,转向转向 对表观基因组、转录组、调控组、宏基因组等各个生物层面 上的分析,转向用系统生物学观点研究生物复杂系统的基本 规律。 系统复杂性的体现系统复杂性的体现系统复杂性的体现系统复杂性的体现::无论是基因的表达还是蛋白质的功能无论是基因的表达还是蛋白质的功能,, 在很多情况下,都是多个基因、多种蛋白质相互作用的结果 学科发展趋势学科发展趋势:数学、物理、计算科学、系统科学、控制 科学、信息科学与生物学的综合应用 核心与源头核心与源头:基因组信息学 “读懂”基因组的核苷酸顺序,即全部基因在染色体上的 确切位置以及各DNA 片段的功能 在发现了新基因信息之后进行蛋白质空间结构模拟和预测在发现了新基因信息之后进行蛋白质空间结构模拟和预测 依据特定蛋白质的功能进行药物设计 了解基因表达的调控机理了解基因表达的调控机理,,根据生物分子在基因调控中的根据生物分子在基因调控中的 作用,描述人类疾病的诊断、治疗内在规律 §§4.14.1 基因与基因组学基因与基因组学 基因基因与基因组数据与基因组数据:以核酸序列、蛋白质序列为主(一维 数字序列数字序列)) 目的目的:解读遗传语言的奥秘 以往关注以往关注较多的工作较多的工作: 编码区 (coding regions ) 编码区 (coding regions ) 部分调控序列(regulatory regions ) 绝大部分的非编码区:未知? A)A) 大规模、高通量测序大规模、高通量测序中的数据分析中的数据分析 大规模测序的每一个环节都与数据分析紧密相关 过程复杂、工作量大 有效的数据分析算法与软件 高通量测序技术(新一代、下一代):复杂微生物群 落的基因组测序、新的挑战 大规模测序及大规模测序及 数据分析过程 大规模测序数据分析的关键问题大规模测序数据分析的关键问题 序列拼接序列拼接((AssembleAssemble)) 填补序列间隙填补序列间隙填补序列间隙填补序列间隙 举例举例: PhrapPhrap软件软件(Green(Green EwingEwing, 1998)1998) (/UTGC/analysistools/phrap.htm) GigAssembler软件(Kent Haussler, 2000) g ( , ) 将测序得到的原始序列拼接成片段重叠群(contig) ,并进 一步拼接成更大的一步拼接成更大的contigcontig。。 核心算法问题:优化算法,如动态规划算法(dynamic programming )、贪婪算法(greedy algorithm ) 高通量测序的宏 基因组和宏转录 组数据分析过程 B)B) 新基因的发现新基因的发现 通过计算分析从通过计算分析从通过计算分析从通过计算分析从ESTEST数据库发数据库发数据库发数据库发现现新基因新基因新基因新基因 EST(Expressed Sequence Ta

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档