核酸序列分析及结构预测主 讲张军细胞生物学及遗传学教研室课件.ppt

核酸序列分析及结构预测主 讲张军细胞生物学及遗传学教研室课件.ppt

  1. 1、本文档共106页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
核酸序列分析及结构预测主 讲张军细胞生物学及遗传学教研室课件

第二节 序 列 比 较 序列比较的根本任务: 发现序列之间的相似性 辨别序列之间的差异 序列比较的目的: 相似序列 ? 相似的结构,相似的功能 判别序列之间的同源性 推测序列之间的进化关系 序列的相似性 同源(homology)- 具有共同的祖先 直向同源(Orthologous ) 共生同源(paralogous ) 相似(similarity) 同源序列一般是相似的 相似序列不一定是同源的 进化趋同(同功能) 序列相似性的描述 定性的描述 定量的数值 相似性 距离 序列比较的基本操作是比对(Alignment) 两个序列的比对是指这两个序列中各个字符的一种一一对应关系,或字符的对比排列 。 字母表和序列 字母表(字符或符号集合) 4字符DNA字母表:{A, C, G, T} 扩展的遗传学字母表或IUPAC编码 单字母氨基酸编码 序列比较可以分为五种基本情况: (1)两条长度相近序列相似性分析,找出序列的差别 (2)判断一条序列的前缀与另一条序列的后缀相似 (3)判断一条序列是否是另一条序列的子序列 (4)判断两条序列中是否有非常相似的子序列 (5)对多个序列进行上述4种分析 扩展的编辑操作 ACCGACAATATGCATA ? ? ? ? ? ATAGGTATAACAGTCA 第七节 DNA序列分析 DNA序列分析 ——基因序列 ——基因表达调控信息 寻找基因牵涉到两个方面的工作 : 识别与基因相关的特殊序列信号 预测基因的编码区域 结合两个方面的结果确定基因的位置和结构 基因表达调控信息隐藏在基因上游区域,在组成上具有一定的特征,可以通过序列分析识别这些特征。 Ⅰ DNA序列分析步骤和分析结果评价 在DNA序列中,除了基因之外,还包含许多其它信息,这些信息大部分与核酸的结构特征相关联,通常决定了DNA与蛋白质或者DNA与RNA的相互作用。 存放这些信息的DNA片段称为功能位点 如启动子(Promoter)、基因终止序列(Terminator sequence)、剪切位点(Splice site)等。 功能序列分析的准确性来自于对“功能序列”和“非功能序列”的辨别能力。 两个集合: 训练集(training set) 用于建立完成识别任务的数学模型。 测试集或控制集(control set) 用于检验所建模型的正确性。 用训练集中实例对预测模型进行训练,使之通过学习后具有正确处理和辨别能力。然后,用模型对测试集中的实例进行“功能”与“非功能”的判断,根据判断结果计算模识别的准确性。 Sn ——敏感性 Sp ——特异性 Tp是正确识别的功能序列数, Tn为正确识别的非功能序列数, Fn是被错误识别为非功能序列的功能序列数, Fp是被错误识别为功能序列的非功能序列数。 敏感性和特异性的权衡 对于一个实用程序,既要求有较高的敏感性,也要求有较高的特异性。 如果敏感性很高,但特异性比较低,则在实际应用中会产生高比率的假阳性; 相反,如果特异性很高,而敏感性比较低,则会产生高比率的假阴性。 对于敏感性和特异性需要进行权衡,给出综合评价指标。 功能位点分析 功能位点(functional site) 与特定功能相关的位点,是生物分子序列上的一个功能单元,或者是生物分子序列上一个较短的片段。 功能位点又称为功能序列(functional sequence)、序列模式(motif)、信号(signal)等。 核酸序列中的功能位点包括转录因子结合位点、转录剪切位点、翻译起始位点等。 在蛋白质序列分析中,常使用序列模式这个名词,蛋白质的序列模式往往与蛋白质结构域或者作用部位有关。 基因组序列中若干个相邻的功能位点组合形成功能区域(functional region)。 功能位点分析的任务 发现功能位点特征 识别功能位点 A 利用共有序列有哪些信誉好的足球投注网站功能位点 共有序列(common consensus)又称一致性片段 共有序列是关于功能位点特征的描述,它描述了功能位点每个位置上核苷酸进化的保守性 例如: NTATN 利用共有序列进行功能位点分析牵涉到两个方面的问题, 如何构造共有序列 如何利用共有序列在给定的核酸序列上有哪些信誉好的足球投注网站寻找功能位点,并计算所找到的功能位点的可靠性 共有序列具有以下几个方面的特征: (1)共有序列中既有保守的位置,也有可变的位置; (2)任何位置上的核苷酸可以用15种类型之一来表示: 共有序列构造过程: (1) 初始化共有序列为一系列可变位置,以“N”代表 (2) 在可变位置寻找出现次数最多的核苷酸,并将该位置转化为保守位

文档评论(0)

2017meng + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档