- 1、本文档共35页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 生物信息学研究方法概述 马飞 南京师范大学 比较基因组学与生物信息学实验室 * * 一、生物信息学研究方法概述 1 生物信息学研究的三个层面 初级层面 中级层面 高级层面 初级层面 基于现有的生物信息数据库和资源,利用成熟的生物信息学工具(专业网站、软件)解决生物信息学问题 ——生物信息数据库(NCBI、EBI等) ——基因组序列分析、序列比对软件(GCG、BLAST、CLUSTAL等) ——系统发育树构造软件(PHYLIP、PALM、MEGA等) ——分子动力学模拟软件(GROMACS、NAMD等) ——搜集、整理有特色的生物信息学数据集 中级层面 利用数值计算方法、数理统计方法和相关的工具,研究生物信息学问题 ——概率、数理统计基础 ——科学计算基础 ——现有的数理统计和科学计算工具(EXCEL、SPSS、SAS、 MATLAB等) ——建立有特色的生物信息学数据库 高级层面 提出有重要意义的生物信息学问题;自主创新,发展新型方法,开发新型工具,引领生物信息学领域研究方向。 ——面向生物学领域,解决生物学问题 ——数学、物理、化学、计算科学等思想和方法 ——建立模型,发展算法 ——自行编程,开发软件,建立网页(Linux系统、C/C++、PERL、 数据库技术) /test/amphioxusest/ /test/rg01/index.php 从事生物信息学研究应具备多方面的科学基础 (1)、一定的计算能力,包括相应的软、硬设备。要有各种数据库或者能与国际、国内的数据库系统进行有效的交流。要有发达、稳定的互联网络系统; (2)、强有力的创新算法和软件。没有算法创新,生物信息学就无法获得持续的发展; (3)、与实验科学,特别是与自动化的大规模高通量的生物学研究方法与平台技术建立广泛、紧密的联系。这些技术,既是产生生物信息数据的主要方法,又是验证生物信息学研究结果的关键手段。 从事生物信息学研究的人员必须具备多学科交叉的知识。 2 生物信息学的“降龙十八掌” 第一式 见龙在田 (1) 掌握生物信息数据库及其查询有哪些信誉好的足球投注网站方法 (Database searching) ——对分子生物信息数据库的种类以及某些具体数据库的掌握和了解 ——从现有数据库中熟练获得需要的数据信息(尤其是二级数据库) ——能熟练地进行数据库查询和数据库有哪些信誉好的足球投注网站(数据库查询系统Entrez、SRS;有哪些信誉好的足球投注网站工具BLAST等) ——数据库技术、互联网技术 第二式 飞龙在天 (2) 学会生物信息学软件和工具的应用 (Software application) 利用成熟的生物信息学工具(专业网站、软件)解决生物信息学问题 ——基因组序列分析、序列比对软件(GCG、BLAST、CLUSTAL等) ——系统发育树构造软件(PHYLIP、PALM等……) ——基因芯片检测分析软件(商业软件ScanArray、Array-Pro等 ……) ——分子动力学模拟软件(GROMACS、NAMD等……) 第三式 鸿渐于陆 (3) 掌握概率论基础 (Probability theory) ——随机事件、概率 ——随机变量、概率分布 ——大数定律、中心极限定理 ——几乎用于生物信息学的各个方面 “Most of the problems in computational sequence analysis are essentially statistical.” ——“Biological sequence analysis” 第四式 或跃在渊 (4) 掌握数理统计基础 (Statistical methods) ——样本和统计量(方差、均值……) ——参数估计、假设检验 ——基本的统计分析(方差分析、协方差分析、回归分析) ——常用统计软件的运用(SPSS、SAS) ——几乎用于生物信息学的各个方面 第五式 羚羊触藩 (5) 熟悉基于频率的组分分析方法和权重矩阵方法 (Composition analysis weight matrix method) ——符号(如碱基)频率反映具有生物学意义的序列特征,如内含子剪接位点的发现,KOZAK规则的发现等 ——核酸组分、氨基酸组分、密码子使用频率 ——k-tuples/k-mers频率分析 ——权重矩阵(weight matrix) 分析 ——主要用于具有特定生物学意义的序列特征的分析 权重矩阵分析方法举例 例:人类基因内含子/外显子剪接位点的序列特征分析 R = A or G Y = C or U N = A, G, C or U 供体位点 受体位点 Bayesian
文档评论(0)