生物信息学的算法课件.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学的算法课件.ppt

生物信息学方法简介 (以下讲义来自北京大学生物信息中心) * * §1 生物信息学研究方法概述 1.1 生物信息学研究的三个层面 初级层面 中级层面 高级层面 初级层面 基于现有的生物信息数据库和资源,利用成熟的生物信息学工具(专业网站、软件)解决生物信息学问题 ——生物信息数据库(NCBI、EBI等) ——基因组序列分析、序列比对软件(GCG、BLAST、CLUSTAL等) ——系统发育树构造软件(PHYLIP、PALM、MEGA等) ——分子动力学模拟软件(GROMACS、NAMD等) ——搜集、整理有特色的生物信息学数据集 中级层面 利用数值计算方法、数理统计方法和相关的工具,研究生物信息学问题 ——概率、数理统计基础 ——科学计算基础 ——现有的数理统计和科学计算工具(EXCEL、SPSS、SAS、 MATLAB等) ——建立有特色的生物信息学数据库 高级层面 提出有重要意义的生物信息学问题;自主创新,发展新型方法,开发新型工具,引领生物信息学领域研究方向。 ——面向生物学领域,解决生物学问题 ——数学、物理、化学、计算科学等思想和方法 ——建立模型,发展算法 ——自行编程,开发软件,建立网页(Linux系统、C/C++、PERL、数据库技术) 从事生物信息学研究应具备多方面的科学基础: (1)、一定的计算能力,包括相应的软、硬设备。要有各种数据库或者能与国际、国内的数据库系统进行有效的交流。要有发达、稳定的互联网络系统; (2)、强有力的创新算法和软件。没有算法创新,生物信息学就无法获得持续的发展; (3)、与实验科学,特别是与自动化的大规模高通量的生物学研究方法与平台技术建立广泛、紧密的联系。这些技术,既是产生生物信息数据的主要方法,又是验证生物信息学研究结果的关键手段。 从事生物信息学研究的人员必须具备多学科交叉的知识。 1.2 生物信息学的“降龙十八掌” 第一式 见龙在田 (1) 要掌握生物信息数据库及其查询有哪些信誉好的足球投注网站方法 (Database searching) ——对分子生物信息数据库的种类以及某些具体数据库的掌握和了解 ——从现有数据库中熟练获得需要的数据信息(尤其是二级数据库) ——能熟练地进行数据库查询和数据库有哪些信誉好的足球投注网站(数据库查询系统Entrez、SRS;有哪些信誉好的足球投注网站工具BLAST等) ——数据库技术、互联网技术 第二式 飞龙在天 (2) 要学会生物信息学软件和工具的应用 (Software application) 利用成熟的生物信息学工具(专业网站、软件)解决生物信息学问题 ——基因组序列分析、序列比对软件(GCG、BLAST、CLUSTAL等) ——系统发育树构造软件(PHYLIP、PALM等……) ——基因芯片检测分析软件(商业软件ScanArray、Array-Pro等 ……) ——分子动力学模拟软件(GROMACS、NAMD等……) 第三式 鸿渐于陆 (3) 概率论基础 (Probability theory) ——随机事件、概率 ——随机变量、概率分布 ——大数定律、中心极限定理 ——几乎用于生物信息学的各个方面 “Most of the problems in computational sequence analysis are essentially statistical.” ——“Biological sequence analysis” 第四式 或跃在渊 (4) 数理统计基础 (Statistical methods) ——样本和统计量(方差、均值……) ——参数估计、假设检验 ——基本的统计分析(方差分析、协方差分析、回归分析) ——常用统计软件的运用(SPSS、SAS) ——几乎用于生物信息学的各个方面 第五式 羚羊触藩 (5) 基于频率的组分分析方法和权重矩阵方法 (Composition analysis weight matrix method) ——符号(如碱基)频率反映具有生物学意义的序列特征,如内含子剪接位点的发现,KOZAK规则的发现等 ——核酸组分、氨基酸组分、密码子使用频率 ——主要用于具有特定生物学意义的序列特征的分析 权重矩阵分析方法举例 ——针对序列信号(一段核酸、蛋白),计算每一位点所使用的词汇或叫符号(碱基、氨基酸)频率,频率的偏好性反映信号的序列特征(sequence pattern)。 例:人类基因内含子/外显子剪接位点的序列特征分析 R = A or G Y = C or U N = A, G, C or U 供体位点 受体位点 Bayesian打分函数用于剪接位点预测的公式 The likelihood that a property value v (of a new stru

文档评论(0)

带头大哥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档