根据引物定位PCR产物序列及基因组位置.pdf

根据引物定位PCR产物序列及基因组位置.pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
根根据据引引物物定定位位PPCCRR产产物物序序列列及及基基因因组组位位置置 查阅⽂献或者专利时,有⼀个序列是 ⾮常需要,但是相关⽂献/专利只提供了相关引物以及该引物所在基因名,并没有提供可扩增得到的具体序 列以及位置信息,当然可以进⾏PCR实验扩增出⽬标序列,再进⾏测序即可得到 ⽬标序列。但是这有些⿇烦了,下⾯介绍⼀下我是如何通过⽣信 的⼿段只根据双端引物来⼀步⼀步确定该引物可扩增得到的⽬标序列以及在 ⽬标序列⼈类基因组上的具体坐标的: 这⾥我介绍了两种⽅法 : 2. 基于⼿动Blast对⽐寻找 :适合批量操作,有很多使⽤In-Silico PCR不能找到的序列,可以使⽤该⽅法查找到,但是该⽅法需要有较强的⽣信 基础 (会操作linux ,会使⽤相关脚本语⾔python或perl)。 那就像专利似的搞⼀个实施例吧: ⽐如在⽂献中找到的下表的某⼀个序列, ⾮常需要该序列在基因组的具体位置信息,但是⽂献中只提供了前后两个引物Primer1/Primer2,基 因名还有 ⽬标产物的长度 : Gene:HS3ST2 PCR product size:140bp Primer- 1:ATAATTTCCAGAAAG Primer-2:AGCATGAGAAAGAGGGACA ⾸先使⽤UCSC的 In-Silico PCR⼯具,将两个序列分别输⼊ (⼀定要勾选Flip Reverse Primer框,因为⽂献/专利提供引物⽅向不确定) : In-Silico PCR输⼊ 然后点击submit即可,如果成功,会显⽰以下的结果 (给出了序列的位置和具体的序列信息,还提供了退⽕温度等) : In-Silico PCR结果 但是该⼯具难以批量操作,那么接下来我介绍⼀下第⼆种⽅法是如何进⾏批量操作的: 1. 将所选序列存成Fasta⽂件格式 2. 进⾏Blast ,见具体代码 : blastn -task blastn-short -query Target.fasta -evalue 100 -word_size 4 -db hg 19_genome -outblast.xls -outfmt 7 -num_threads 20 CT.log21 因为引物序列较短,因此blastn使⽤blastn-short模式,Target.fasta存储了上⼀步的序列信息,-db 后边输⼊的是⼈hg 19的参考基因组,-out 是输出信息,-outformat是输出⽂件格式,其中7是tab分隔⽂件。 最关键的除了blastn-short模式,另外两个参数是-evalue和-wordsize 其中evalue就是期望值,该该值值设设置置越越⼩⼩说说明明⽐⽐对对结结果果越越准准确确 ,但是结果数 ⽬也越少 ;wordsize表⽰length of best perfect match,即最最佳佳 匹匹配配的的长长度度 ,,该该值值设设置置越越⼤⼤,,得得到到结结果果越越准准确确 ,得到匹配结果也越少。 为了得到尽量多的⽐对结果,因此尽量要把两个条件设的宽松⼀些,根据测试结果最后将evalue设为了100 (blastn默认该值为 10),wordsize 设为了4。 3. blast结果汇总 blastn得到的结果 :有表头和Primer1,Primer2⽐对到的所有结果 :结果中有详细的⽐对位置等信息 Primer1候选结果 1153个,Primer2候选结果524个,那么如何从这么多候选结果中找到 ⽬标组合呢: Primer- 1⽐对结果 Primer-2⽐对结果 具体的脚本有些复杂,我就不放在这⾥了,主要说⼀下操作的思路 : 4. 结果 上⼀步最终筛选得到的结果如下表 :虽然上述初始⽐对结果很多,但是位于⽬标基因区间只有以下18个⽐对结果,将⽐对结果按照⽐对的Start位 置从低到⾼排序,然后挑选PrimerID⼀列中上下两列不同的组合,最后根据Length (后⼀列的Start减去前⼀列的End得到)确定最终的组合 (标黄),所得组合产物长度 (14 1bp)与⽂献中所给 (140bp)相吻合 (经多个引物测试⼀般最后得到的组合

文档评论(0)

147****4268 + 关注
实名认证
内容提供者

认真 负责 是我的态度

1亿VIP精品文档

相关文档