- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
根根据据引引物物定定位位PPCCRR产产物物序序列列及及基基因因组组位位置置
查阅⽂献或者专利时,有⼀个序列是 ⾮常需要,但是相关⽂献/专利只提供了相关引物以及该引物所在基因名,并没有提供可扩增得到的具体序
列以及位置信息,当然可以进⾏PCR实验扩增出⽬标序列,再进⾏测序即可得到 ⽬标序列。但是这有些⿇烦了,下⾯介绍⼀下我是如何通过⽣信
的⼿段只根据双端引物来⼀步⼀步确定该引物可扩增得到的⽬标序列以及在 ⽬标序列⼈类基因组上的具体坐标的:
这⾥我介绍了两种⽅法 :
2. 基于⼿动Blast对⽐寻找 :适合批量操作,有很多使⽤In-Silico PCR不能找到的序列,可以使⽤该⽅法查找到,但是该⽅法需要有较强的⽣信
基础 (会操作linux ,会使⽤相关脚本语⾔python或perl)。
那就像专利似的搞⼀个实施例吧:
⽐如在⽂献中找到的下表的某⼀个序列, ⾮常需要该序列在基因组的具体位置信息,但是⽂献中只提供了前后两个引物Primer1/Primer2,基
因名还有 ⽬标产物的长度 :
Gene:HS3ST2
PCR product size:140bp
Primer- 1:ATAATTTCCAGAAAG
Primer-2:AGCATGAGAAAGAGGGACA
⾸先使⽤UCSC的 In-Silico PCR⼯具,将两个序列分别输⼊ (⼀定要勾选Flip Reverse Primer框,因为⽂献/专利提供引物⽅向不确定) :
In-Silico PCR输⼊
然后点击submit即可,如果成功,会显⽰以下的结果 (给出了序列的位置和具体的序列信息,还提供了退⽕温度等) :
In-Silico PCR结果
但是该⼯具难以批量操作,那么接下来我介绍⼀下第⼆种⽅法是如何进⾏批量操作的:
1. 将所选序列存成Fasta⽂件格式
2. 进⾏Blast ,见具体代码 :
blastn -task blastn-short -query Target.fasta -evalue 100 -word_size 4 -db hg 19_genome -outblast.xls -outfmt 7 -num_threads
20 CT.log21
因为引物序列较短,因此blastn使⽤blastn-short模式,Target.fasta存储了上⼀步的序列信息,-db 后边输⼊的是⼈hg 19的参考基因组,-out
是输出信息,-outformat是输出⽂件格式,其中7是tab分隔⽂件。
最关键的除了blastn-short模式,另外两个参数是-evalue和-wordsize
其中evalue就是期望值,该该值值设设置置越越⼩⼩说说明明⽐⽐对对结结果果越越准准确确 ,但是结果数 ⽬也越少 ;wordsize表⽰length of best perfect match,即最最佳佳
匹匹配配的的长长度度 ,,该该值值设设置置越越⼤⼤,,得得到到结结果果越越准准确确 ,得到匹配结果也越少。
为了得到尽量多的⽐对结果,因此尽量要把两个条件设的宽松⼀些,根据测试结果最后将evalue设为了100 (blastn默认该值为 10),wordsize
设为了4。
3. blast结果汇总
blastn得到的结果 :有表头和Primer1,Primer2⽐对到的所有结果 :结果中有详细的⽐对位置等信息
Primer1候选结果 1153个,Primer2候选结果524个,那么如何从这么多候选结果中找到 ⽬标组合呢:
Primer- 1⽐对结果
Primer-2⽐对结果
具体的脚本有些复杂,我就不放在这⾥了,主要说⼀下操作的思路 :
4. 结果
上⼀步最终筛选得到的结果如下表 :虽然上述初始⽐对结果很多,但是位于⽬标基因区间只有以下18个⽐对结果,将⽐对结果按照⽐对的Start位
置从低到⾼排序,然后挑选PrimerID⼀列中上下两列不同的组合,最后根据Length (后⼀列的Start减去前⼀列的End得到)确定最终的组合
(标黄),所得组合产物长度 (14 1bp)与⽂献中所给 (140bp)相吻合 (经多个引物测试⼀般最后得到的组合
您可能关注的文档
- 高中语文教学心得体会范文(通用6篇).pdf
- 搞笑的狮子-【完整版】.doc
- 个人财务管理系统论文.docx
- 个人简历表格-完整版.doc
- 个人简历模板—word版可编辑.docx
- 个人就业swot分析范文(精选10篇).pdf
- 个人理财--张先生家庭理财案例分析方案.docx
- 工程创优方案.docx
- 工程回访和维修管理办法.docx
- 工程量清单封面、编制说明.doc
- 2024至2030年中国人造棉面料行业投资前景及策略咨询报告.docx
- 重庆市渝中区遴选公务员2024年国家公务员考试考试大纲历年真题10340笔试历年典型考题及解题思路附.docx
- 2024至2030年中国甲基苯乙酮行业深度调研及发展预测报告.docx
- 2024至2030年中国羚羊角类饮片行业深度调查与前景预测分析报告.docx
- 重庆市面向中国农业大学定向选调2024届大学毕业生2024年国家公务员考试考试大纲历年真题14笔试历.docx
- 重庆市面向西北工业大学定向选调2024届大学毕业生00笔试历年典型考题及解题思路附答案详解.docx
- 中国不动杆菌感染治疗药行业市场现状分析及竞争格局与投资发展研究报告2024-2029版.docx
- 2024至2030年全球与中国ETL软件市场现状及未来发展趋势.docx
- 初中八年级(初二)生物下册期末考试1含答案解析.docx
- 干簧式继电器项目申请报告.docx
文档评论(0)