- 1、本文档共62页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学软件的使用-高通量数据生物信息专业分析平台
Thanks! * 生物信息学并不存在标准定义,对此有各种理解。我接觉得比较合适的一种定义是…… * 对核酸的分析是生物信息学的基础功能。 蛋白序列的同源比较要比DNA序列的同源比较敏感2~5倍 下面是一些具体的应用。 * 只需一个短小的EST片断,就可能钓出一整条基因来,避免了重复工作,大大加快实验进度。 … * Entrez是由NCBI开发和维护的一个集成检索数据系统,允许对pubmed,核苷酸和蛋白质的序列数据库,三维结构信息和图谱信息进行集成访问。 * Dot plot 点阵图能够揭示多个局部相似性的复杂关系。 * 不同颜色代表不同的AA * 下面看一些软件应用的例子 * * 3---也叫做同源建模 * 依靠MMDB中ASN.1记录格式,信息量大而紧凑,是一种理想的三维数据库浏览格式。 * 依靠PDB数据库及其格式,其中没有生物高聚物的完整化学键信息,无需残基辞典,而迫使利用化学规则编程。对记录数据的要求最低。 而MMDB与PDB相比增加了附加信息,运用标准的“残基辞典”,记录了生物高聚物的信息。 因此更为真实可信。另外还有一种mmCIF格式 功能4. 用计算机预测新基因及其结构和功能 对CDS(Coding Sequence)蛋白编码区的预测准确率已达到90%以上 对整个基因结构的预测存在一定难度 PWM(位置权重矩阵)算法 由物化原理技术开发,侧重于找基因表达系统和核酸相互作用的位点。给信号序列各个位置每种可能出现的核苷酸分配一个分数,将各位置分数相加后得出该序列作为潜在作用位点的分数。 DNASIS 2.5 对蛋白编码区的预测A. (Codon Bias) DNASIS 2.5 对蛋白编码区的预测B. (Rare Codon) DNASIS 2.5 对蛋白编码区的预测C. (ORF List) DNASTAR 之 GeneQuest 预测CDS 功能5.蛋白高级结构预测 该项技术算法十分复杂,尚未成熟。PDB及MMDB数据库目前仍然禁止收录软件预测出来的蛋白高级结构模型。 X射线晶体学技术和多维核磁共振技术是当前人们认识蛋白高级结构的主要手段,但两种技术都有不足之处。前者要求必需得到高标准的蛋白晶体,后者对分子量大于3万的大蛋白不能测定。因此理论模拟和结构预测显得十分重要。 序列与结构关系的根源在于“蛋白质折叠的问题”,这是近期研究关注的焦点。 目前应用的蛋白质结构预测的算法 同源预测(一级结构决定高级结构) 结构与结构相对比(DALI算法) 当前最先进的结构预测方法: 结构类识别(fold recognition) 先建立一个已知的结构类数据库(fold library),将待测序列“穿过”该数据库构成的座标,并根据事先确定的物理限制,逐个位置移动(threading, sequence-structure alignment) ,并用一个函数(sequence-structure fitness alignment) 判断序列与结构类的符合程度,找出未知序列在目标结构上的能量最优和构象最稳固的比对位置。对计算机要求很高。 Cn3D 2.5 显示 1EQF A链三维结构 RasMol 2.7 显示1EQF A链三维结构 PDB与MMDB结构图比较 三. 生物学软件部分常见功能使用技巧 PCR 引物设计 引物设计的原则 ? 首先引物要跟模板紧密结合,其次引物与引物之间不能有稳定的二聚体或发夹结构存在,最后引物不能在别的非目的位点引起高效DNA聚合反应(即错配)。 围绕这几条基本原则,设计引物需要考虑诸多因素,如引物长度(primer length),产物长度(product length),序列Tm值 (melting temperature),ΔG值(internal stability),引物二聚体及发夹结构(duplex formation and hairpin),错误引发位点(false priming site),引物及产物GC含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。 引物设计要点 一般引物的长度为16-23bp,常用的长度为18-21bp,过长或过短都不合适。 引物3’端的碱基一般不用A,因为A在错误引发位点的引发效率相对比较高,而其它三种碱基的错误引发效率相对小一些。 引物的GC含量一般为45-55%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。 引物所对应模板序列的Tm值最好在72℃左右,当然由于模板序列本身的组成决定其Tm值可能偏低或偏高,可根据具体情况灵活运用。 ΔG值反映了引物与模板结合的强弱程度,也是一个重要的引物评价指标,一般情况下,在Oligo 5.
文档评论(0)