2010年工作规划-中国计算蛋白质组学研讨会CNCP-2018.PPT

2010年工作规划-中国计算蛋白质组学研讨会CNCP-2018.PPT

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2010年工作规划-中国计算蛋白质组学研讨会CNCP-2018

最下面这一行,是我们常规的流程,也就是我们上面宣称的, 从第三行到第二行,我们缩减了谱图的数目,速度提升约10倍 从第二行到第一行,我们缩减有哪些信誉好的足球投注网站空间,速度提升了约17倍, 综合下来,我们可以宣传:干、湿技术结合:速度提升了160倍 * 我们第一版pFind在2003年问世,13年期间,我们发展了各种质谱数据处理软件。2016年,我们计划发布pFind pLink pGlyco和pAnno * 也就是我要报告的第二部分内容 * 先打一个比喻,最近几年的手机技术发展史,可以分为iPhone4之前和iPhone4之后 * 我们的交联鉴定 也可以分为2012年之前和2012年之后 2012年,我们和ruedi实验室同期发表了文章,报告了交联肽段鉴定的FDR计算公式 * 也就是 对交联肽段 一正一反 反反 正正结果的比例是 2:1:1 * 那么 对pLink1来说,最大的贡献是可以估计FDR * 而从pLink1到pLink2,主要改进有3点,分别是 * 我们先看谱图预处理,具体来说,就是确定母离子的单同位素峰 这里分别是一个单肽的一级谱图信号 和 一个交联肽段或者说双肽的一级谱图信号 双肽的质量更大,单同位素峰更低,同位素峰数目更多,确定单同位素峰更困难 * 我们在pLink1中,使用了大窗口的有哪些信誉好的足球投注网站策略。即便二级谱图中记录的单同位素峰是错误的,我们也能确保正确答案在候选空间内。这导致的结果是pLink1的有哪些信誉好的足球投注网站空间大。 * 我们开发了pParse软件,可以判断单同位素峰,那么我们的母离子质量误差只需要设置为20ppm,有哪些信誉好的足球投注网站空间小。 * 在介绍改进2之前,先介绍下现在交联肽段鉴定的基本思路即基于肽段索引的开放式有哪些信誉好的足球投注网站。 我们不是对肽段进行两两组合,而是对单肽进行开放式有哪些信誉好的足球投注网站,即允许一端有一个较大质量的修饰 * 然后,再对可信的单肽进行两两组合,重新进行交联肽段打分 * 但是,现在的肽段索引有一个问题,即无效匹配过多。 比如:对一张实际谱图,和来自数据的所有理论肽段进行匹配,有时候,匹配上的谱峰数目为0,但是,却消耗了时间。 * 而离子索引,可以实现谱峰与谱峰间的匹配。像这种与实际谱图完全不相干的理论谱图,是不会出现在有哪些信誉好的足球投注网站空间内的,也就是,不会消耗匹配时间。 这就达到了加速的目的 * 第三个改进,就是引入了机器学习技术,我们选取了以下11维特征 * 并用SVM模型进行在线训练 我们在pLink1中,使用的是计算E-value的方法,该方法耗时长,适应性弱 * 我们在10余套数据上进行了pLink2与pLink1的对比,大概结论是: * 改进1 贡献的 改进2 贡献的 * 我们还将pLink2与Kojak进行了对比。Kojak是西雅图的系统生物学研究所开发的。这分别是一作和通讯作者。 * Kojak的流程与pLink1类似。pLink1使用开放式索引,保留最可信的前500条单肽。 * Kojak保留最可信的前250条单肽,并且引入了Percolator机器学习。 * 我们构造了一个标注数据集进行对比分析。我们合成了38条肽段。pLink有哪些信誉好的足球投注网站只含38条肽段的数据库,经过手工验证,可以得到1030张谱图,作为正确结果。 同时,我们还有1047张母离子质量增加50ppm的谱图,作为错误结果。 * 我们将这2077张谱图,分别用pLink2和Kojak进行有哪些信誉好的足球投注网站,有哪些信誉好的足球投注网站的是正确答案和人库的混合库 * pLink2用时569秒,也就是10分钟,Kojak用时3010秒,也就是50分钟。 * 可能有老师或同学会好奇,你们是不是用集群进行的有哪些信誉好的足球投注网站,不是。我们就用了一台性能稍好的PC机,开了4个线程。 * 我们说,2000张 * 我们再看一下精度 一般交联鉴定,我们卡FDR为小于等于5% 这种情况下,Kojak报告了77个肽谱匹配,pLink2报告了1000多个肽谱匹配。 我们可能会问,pLink2报告的对吗? * pLink2多报告的结果中,有95%的肽谱匹配与正确结果一致。这与我们卡的谱图层次FDR小于等于5%吻合。 说明pLink2精度是不错的。 * 第二个测试数据,我们使用了15N代谢标记技术。 大家也可以看CNCP报告人钟红英老师的文章。 这里做一下简单介绍,给定一张谱图,我们有两个候选肽,分别是两个引擎的鉴定结果 * 我们将两个结果分别去一级谱图上检查,看是否存在轻、重同位素峰簇对儿。 候选肽段1含有24个N,而一级谱图轻、重信号正好相差24Da,计算比值为1:1 候选肽段2含有19个N,在一级谱图上找不到信号对儿,得到的比值为NaN,not a number * 这证明pLink2多鉴定的结果,也是比较可信的。 * 除此之外,pLink2还支持可碎裂交联。这里,感谢黄岚老师和刘凡博士的精彩工作。 有了可碎裂交联技术,我们就有了特征峰

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档