HIV1整合酶S19DE2C融合蛋白的定向整合及其整合位点的预测和分析.docx

HIV1整合酶S19DE2C融合蛋白的定向整合及其整合位点的预测和分析.docx

  1. 1、本文档共82页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
HIV1整合酶S19DE2C融合蛋白的定向整合及其整合位点的预测和分析

浙江大学博士学位论文 浙江大学博士学位论文 中文摘要 中文摘要 本研究有两个主要目的,首先研究HIV.1整合酶通过一定修饰后,在人类基 因组上定向整合的能力,为后续的HIV.1整合位点偏好性研究提供实验依据;其 次使用支持向量机(Support Vector Machine,SVM)的方法,通过对已知HIV一1整 合酶的整合位点附近DNA序列的学--O,建立一个能够有效预测整合位点的生物信 息学模型。 实验方法 1.为了研究HIV.1整合酶的定向整合功能,我们对野生型HIV.1整合酶引入 S119D突变,然后使其与多锌指蛋白E2C融合。该融合蛋白能够特异性地识别人 类基因组上的特定DNA序列位点。融合蛋白通过反式包装(in trans)进入HIV.1 病毒载体,感染细胞后,依次使用生物素引物标记、磁珠富集以及接头介导PCR 等方法,对HIV.1整合酶S1 19D/E2C融合蛋白定向整合位点附近的DNA进行富 集和扩增,最终用454测序获得全基因组上的整合位点信息。 2.为了解决上述实测整合位点实验周期长的弊端,我们对基因组综述序列 (Genome Survey Sequences)数据库中已有的HIV.1整合位点序列进行了整理, 提取最可靠的基因组单一匹配序列作为训练数据集。根据支持向量机的算法,使 用LibSVM、Matlab和自编的Peal脚本程序对训练数据集进行学习、训练,以建 立准确率较高的预测模型,并用于进一步分析。期望通过该模型对HIV.1整合位 点序列的预测,获得HIV.1整合酶修饰特征与定向整合能力间相关性评估数据, 用于指导设计更优化的实测性研究。 结果 1.首先,通过实验证明了在对HIV.1整合酶的修饰并反式包装进入病毒的过 程中,病毒的包装和感染能力没有明显下降,提示其仍保持作为载体的生物学特 征。其次,使用包含不同融合酶及其突变体和融合蛋白的病毒对HEK293T细胞系 进行感染,提取、扩增整合位点序列,进而使用454测序法对相应整合位点的分 析表明:与野生型整合酶相比,整合酶和E2C融合蛋白在基因组上更倾向在“e2c 位点”附近发生整合反应,提示达到了提高在基因组定向整合的能力的预期目标; Il 浙江大学博士学位论文 浙江大学博士学位论文 中文摘要 整合酶S1 19D突变体降低了HIV.1整合位点处对序列的选择性,提示其随机性插 入偏好性可由此得到适当的控制。 2.通过支持向量机的统计学习方法建立了对HIV.1整合位点的预测模型,其 预测准确率达到了82.09%(AUC-o.8678).具体的建模过程表明,支持向量机 在整合位点预测过程中,训练数据集需要的整合位点数最少在500~1000个。该模 型的预测结果,与实验得到的HIV整合位点序列的特征基本一致。我们不仅预测 到整合反应偏好的序列,还预测到一些整合反应最不偏好的序列,并分别命名为 热点序列和冰点序列。冰点序列目前尚无法通过实验手段得到。 结论 在宏观水平上,借助多锌指蛋白E2C特异性结合DNA的功能,一定程度上 实现HIV.1载体向人类基因组上特定位点的定向整合;在微观水平上,整合酶的 S119D突变降低了整合位点DNA序列上的偏好性.这两个层次的特点在解决 HIV-1对基因组整合位点的选择和可控性上提供了有益的借鉴. 使用支持向量机建立起相应的预测模型,为相关实验的前期设计和分析提供 有效的信息,可以有效地克服现有实验技术和工具的局限性。 关键词:HIV-1,整合酶,E2C蛋白,定向整合,支持向量机 浙江大兰堕主兰垡笙奎 浙江大兰堕主兰垡笙奎 茎兰塑茎 ABSTRACT Our first aim is to construct some fusion proteins of HIV-1 integrase(S 1 1 9D)and polydactyl zinc.-finger protein E2C to perform a targeted integration.The second aim is to establish a support vector machine model to predict the potential integration sites by learning current integration sites obtained by experiments. Methods 1.To study the targeted inte

文档评论(0)

186****0507 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档