13计算表观遗传学教学讲义.ppt

  1. 1、本文档共123页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
13计算表观遗传学教学讲义.ppt

第十三章 计算表观遗传学 ;第一节 引言 ;第二节 基因组的DNA甲基化 ;(一) DNA甲基化与CpG岛;DNA甲基化;CpG岛与DNA甲基化的关系 ;(二) 甲基化对转录的调控;(三) DNA甲基化的意义;(一)CpG岛的定义及预测 ;常见的CpG岛预测算法; 3.排除重复元件对CpG岛预测算法的干扰;4. 基于窗口滑动法的CpG岛预测算法;如果扫描窗中的序列片段不满足CpG岛的定义,扫描窗右移一个窗口的长度。如果扫描得到的CpG岛区域有重叠,则将重叠部分合并。 这种依赖于长度,GC含量和CpG o/e值的一个或全部阈值的CpG岛识别算法有显而易见的缺陷:(1)由于这三个阈值的使用使得参数空间变得很大。(2)预测的CpG岛的长度和数目取决于窗口的长度和步长的预设值,存在主观任意性。(3)CpG岛的起始点一般不是CpG双核苷酸。(4)预测和筛选过程依赖于相同的参数。(5)方法经常需要针对特定物种进行调整。(6)运行时间长。 ;窗口法;And again.;Repeat as needed, until the new window does not meet the CpG island criteria;Then slide the window back toward the island.;Keep sliding until the window meets CpG island criteria. ;If it doesn’t meet the criteria, try trimming a base pair off each end and analyzing again. ;5. 基于相邻CpG二核苷酸距离的 CpG岛预测算法;(1)假设有如下一条序列:TTGCGGGTCCTAGAAGTCGCCTCCCCGCCTTGCCGGCCGCCCTTGCAGCCCCGAGCCGAGCAGC (2) CpGcluster首先找到所有的CpG双核苷酸的位置(粗体):TTGCGGGTCCTAGAAGTCGCCTCCCCGCCTTGCCGGCCGCCCTTGCAGCCCCGAGCCGAGCAGC (3) 然后得到CpG双核苷酸的位置的列表:4;18;26;34;38;52;57 ;(4) 通过公式 计算相邻二核苷酸之间的算术距离:13;7;7;3;13;4 (5)考虑到假设:CpG是伯努利实验的结果,这里设成功为CpG,失败为non-CpG。伯努利实验的概率p可以通过大量的序列算出。令序列的长度为L,N为CpG的数目,则 。(伯努利实验,例如投掷硬币N次,最后一次正面朝上的概率,满足几何分布 )。所以临近的CpG双核苷酸的距离满足几何分布,距离d等于失败的次数。(6) 绘制长度(d)分布和几何分布的直方分布图(图13-4)。从中,我们可以发现观测值分布和理论分布差别很大。短距离出现的概率较大。中位数值恰好可以作为CpG二核苷酸富集的阈值。(7) 为了计算之前步骤找到的CpG簇是CpG岛的概率,需要给出统计学p值,该p值可由负二项分布给出(伯努利实验,例如投掷硬币N次,r次正面朝上的概率,满足负二项分布 )。通过描述CpGcluster的算法原理,我们知道:存在比随机出现CpG二核苷酸之间距离距离更短的CpG簇,通过合并重合的簇,最终得到的簇就被认为是CpG岛。 ;人类基因组1号染色体的邻接CpG二核苷酸之间距离的概率密度函数。观察值的分布以空心圆圈表示,而理论分布即几何分布则用实线表示。中位数值恰好和理论值吻合。距离小于中位数值的两个CpG二核苷酸则被纳入CpG岛的一部分。X轴为距离d,Y轴为概率p。Median为中位数,Mean为均值,带圈实线代表观测值的连线,实线代表几何分布的概率密度曲线。(来自于CpGcluster: a distance-based algorithm for CpG-island detection);算法;表格展示的是LRRMT1的 上游序列的预测结果;6. 结合功能基因组数据的CpG定位方法;(二) 实验方法寻找CpG岛;实验方法确定的基因组范围CpG岛图谱;(三) CpG岛的定位有助于发现新基因;三、实验检测技术测定DNA甲基化状态 (一)DNA甲基化的检测方法 (二)基因组范围的DNA甲基化检测方法 (三)基于高通量测序的DNA甲基化检测方法 (四)高通量检测技术的选??策略;(一)DNA甲基化的检测方法;1. 限制性内切酶法;2. 重亚硫酸钠法;重亚硫酸钠(sodium bisulfite)法;(二)基因组范围的DNA甲基化检测方法;高通量测序是必威体育精装版发展起来的但却

文档评论(0)

yuzongxu123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档