- 1、本文档共24页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
基因组序列注释的方法二、注释的方法根据开放阅读框(ORF)预测起始密码子ATG:第一个ATG的确定依据Kozak规则,所谓Kozak规则,即第一个ATG侧翼序列的碱基分布所满足的统计规律:12若将第一个ATG中的碱基A,T,G分别标为1,2,3位,则Kozak规则可描述如下:01ATG的5’端约15bp范围的侧翼序列内不含碱基T;03除-3,-6和-9位,在整个侧翼序列区,C是偏好碱基05第4位的偏好碱基为G;02在-3,-6和-9位置,G是偏好碱基;0401终止密码子:TAA,TAG,TGA03GC%50%终止密码子每100-200bp出现一次;02GC%=50%终止密码子每64bp出现一次;04由于多数基因ORF均多于50个密码子,因此最可能的选择应该是ORF选择不少于100个密码子。终止密码子:细菌基因组的ORF阅读相对比较简单,错误的概率较少,但单纯的ORF扫描对高等真核生物DNA效果不佳。内含子使ORF扫描复杂化对ORF扫描的基本程序的编写要考虑以下几个问题:编码同一氨基酸的不同密码子称为同义密码,其差别仅在密码子的第3位碱基不同。a、密码子偏倚特定生物体的基因中并不是所有密码子的使用频率都是平等的。如Leu的密码子有6个(TTA、TTG、CTT、CTC、CTA、CTG),在人类基因中,绝大多数Leu都是由CTG编码的,而且几乎不由CTA和TTA编码。特定种属有特征性的密码子偏爱,这些序列在编码区常常出现,非编码区只保持平均的碱基分布水平。外显子和内含子的边界有一些明显的特征如:内含子的5’端常见的顺序为5’-AG↓GTTAAGT-3’;3’端多为5‘PyPyPyPyPyPyCAG-3’(“Py”嘧啶核苷酸,T或C);上游外显子-内含子边界的共有序列在真正基因中发现的真实序列之间的关系。运用外显子-内含子边界特殊序列的方法来注释基因的成功率不高。c、上游调控顺序几乎所有基因(或操纵子)上游都有调控序列,它们与DNA结合蛋白作用,控制基因表达,通过同源性比较来预测mRNA的5’端,最常用的与转录起始位点相关的数据库是真核启动子数据库(TheTRADATProject,EukaryoticPromoterDatabase,EPD.http://www.epd.unil.ch/)。1另外个别基因组特有组成也可作为判别依据,如脊椎动物基因组许多基因的上游都有大约1kb长的CpG岛。2利用已存入数据库中的基因序列与待查基因组序列进行比较,从中查找可与之匹配的碱基序列及其比例用于界定基因的方法。DNA序列某些片段完全相同;开放阅读框排列类似;开放阅读框翻译成的氨基酸序列的相同;模拟多肽高级结构相似。一般认为,氨基酸序列的相似性在25%以上可视为同源基因。这些结果均可作为基因判定的指标,可单独用,也可综合用。1)目前基因注释程序的编写主要依据两种信息内涵:1.signalterms(信号指令),如起始密码,终止密码,终止信号,多聚嘧啶顺序,分支点等保守的顺序组成;2.contentterms(内容指令),如密码子使用偏好.对结构紧凑的小基因组上述注释软件效果不错,但对大基因组特别是超长基因的注释有很大困难.在一个长度数十或数百kb的内含子中,存在许多可能误判的信号指令.2)常用的注释软如GenScan主要偏重于内容指令,而FgeneSH则着重于信号指令.由于每种生物都有种属专一性的密码子偏好,也存在某些非保守的信号指令,因此在超长基因注释中常出现正向错误(false-positive,多注释)或负向错误(false-negetive,少注释).引自:Naturereviewsgenetics,4:741-749,2003.3、通过实验确认基因通过Northern杂交确定DNA片段是表达序列;由EST或cDNA指认基因。EST和cDNA是基因转录加工后的产物,可以确切无疑的代表相应基因成员的存在。a、确认基因的存在:b、确定基因的位置:01?获取基因全长cDNA序列。02根据已知片段设计引物,通过RACE技术得到基因的全长cDNA序列;03?确定DNA顺序中基因的位置。04通过对全长cDNA序列的测序,并与基因组DNA的比较,确定基因所在的区域;05OR通过物种已建立的遗传图和物理图来确定基因的位置061、Jim工程吉姆工程是美国454生命科学公司(基因技术公司)在2005年前给“DNA之父”称誉的美国科学家詹姆斯·
您可能关注的文档
最近下载
- 《文》第十三-名著《经典常谈》思维导图+导语阐述+原文批注+阅读导引+阅读训练.docx VIP
- 工程监理服务项目投标技术文件15针对本工程的合理化建议.docx VIP
- 基于大宗商品交易的供应链金融运作模式研究——以供通云 为例.pdf
- 高级育婴员考试模拟题(含答案).docx VIP
- 04 DeepSeek横空出世科技创新、智能向善热点主题作文导写例文-2025年高考语文二轮复习之作文(全国通用).docx
- 消防监控的述职报告.docx VIP
- 2024年保育员(高级)操作证考试题库附答案.pdf VIP
- 大宗商品交易模式.docx
- 2025年学习贯彻中央八项规定精神问题查摆与整改案例参考.docx VIP
- 更换空调方案.pdf
文档评论(0)