网站大量收购独家精品文档,联系QQ:2885784924

形象化基因组序列分析系统.ppt

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

构架设计子菜单名菜单项功能FileNew新建一空白文件。Open打开现有文件。Save将当前文件进行保存。Export导出参数文件.grm或者模型图像.gif。Exit退出程序。EditDelete删除绘图区中选中的元件。Calculate计算并查看参数文件。ViewGrid是否显示绘图区栅格。Showlabel是否在图形上贴加相应标签。Style选择软件界面风格。HelpHelpContent帮助文件查看。About显示GRMF信息。表3-1主菜单项及其功能现阶段调控元件的研究主要还是相对独立的进行,着眼于单个模体的发现与解读,关于顺势调控模块(cis-regulatorymodule)等也进行了一些相关研究。基因预测的方法也在过去的几年中得到了极大的提高,尤其是基于统计模型的方法。这为基因中调控模块等复杂结构序列的研究提供了新的方法。1.2本文工作说明

本课题上级课题为开发一个通用的具有自动寻找给定的复杂结构序列模块功能的系统。使用该系统,用户可以用文件描述序列的结构,或者直观地用一个图形表示序列结构(例如一个基因结构示意图或者调控因子模块的示意图),该系统可以在给定注释后的集合上自动学习,并可以在指定的基因组序列上自动找到所有类似的结构。STEP5STEP4STEP3STEP2STEP1上级课题主要研究内容及任务分割:一种通用的模型描述系统。该系统规定模型定义文件的格式,我们可以从定义文件自动生成一个序列结构模型。该通用模型的自动学习。给定一个已注释的序列集合,该系统可以自动进行学习。在基因组范围寻找由以上文件定义的复杂序列结构。一个用户友好的图形系统。用户可以直观地用一个图形表示序列结构,对一个指定的学习集合以及基因组,系统可以自动完成前面三步。本文工作主要是从复杂调控子序列研究的现状出发,在调控因子结合位点发现的前人工作基础上,开发一个友好的图形化系统,提供一个可视化的平台,简化调控模块研究的工作。利用该系统可以直观的对用户希望研究的目标模块进行互动的绘制,导入相应参数文件,最终生成待研究模块的完整参数文件,此参数文件可直接进行后续分析。转录因子结合位点(模体)研究方法分为实验方法和计算方法两类。2.1实验方法实验中可以用凝胶迁移(electrophoreticmobilityshiftassays)或DNase足迹法(DNasefootprinting)来确定转录因子结合位点。这些方法不能够实现大规模、高通量的分析。以基因芯片为代表的高通量分子生物学技术在基因转录调控分析中发挥了重大作用。近年来,利用蛋白质免疫共沉淀技术(ChIP)可以得到大量与特定转录因子结合的DNA片段。第二代高通量测序技术检测这些DNA片段,就形成了ChIP-chip和ChIP-sfq技术。2.2计算方法转录因子建模在进行数学方法的计算前必须将转录因子建模,以便在统一的框架下进行分析计算。尽管与同一种转录因子结合位点结合的结合位点会存在差异,但是,不管差异性程度有多高,相对于随机序列片段而言,对应同一种转录因子的结合位点仍然具有较高的保守性,正是这种保守性构成了用计算方法来识别调控元件的理论基础。0102串模型串模型(String-basedrepresentation)是最早出现的序列模式表示方法,其中共有序列(consensussequence)是转录因子结合位点最简单的表示方法。例如CAAT转录因子结合的核酸序列表示为5’-GCCAATCT-3’,热休克因子结合位点表示为5’-CNNGAANNTCCNNG-3’。基于共有序列的表示方法简明易懂,却不能够反映每个位置上不同碱基出现的概率。矩阵模型虽然串模型直观的表示了模式序列的碱基组成情况,但是也在一定程度上掩盖了各个位置上碱基出现的差异性。转录因子同DNA的结合是一个与热动力学结合能相关的随机事件,因此利用统计学方法对转录因子与DNA的相互作用进行建模更为合理。图2-1简单的矩阵模型123456A1000003T100009G00120120C11201200图2-2图2-1对应的PSFM(PWM)123456A0.83300000.25T0.08300000.75G001010C0.08310100可视化模型这类模型一般根据信息论知识,用形象、直观的的图形方式来表示结合位点的特征(如logo模型)。2.3调控元件模式的得分函数Z分数卡方统计量:信息含量12365

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档