- 1、本文档共67页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分子映射指数在化学反应分类预测中的应用-分析化学专业论文
摘 要
对于化学反应数据库的分析来说,化学反应的自动分类是十分重要的,尤其是对于 代谢反应。在这一领域,已经进行的一些研究主要基于反应中心识别。然而,在大多数 的数据库,由于无法得到反应中心的信息,这些方法的应用受到了限制。
化学反应的分子映射指数(MOLecular Maps of Atom-level Properties,MOLMAP) 是产物的 MOLMAP 指数和反应物的 MOLMAP 指数的差异。这个指数不需要预先指定 反应中心,具备能够被广泛应用的潜力。在本论文中,我们采用化学反应的 MOLMAP 指数,对光化学反应数据及生物代谢反应数据分别进行了研究,具体内容如下: 1.光化学反应分类预测研究
数据集来源于德国 InfoChem GmbH 的 SPRESI 数据库,共包含 356 个光化学反应, 每一个反应均包括两个反应物和一个产物。人为的将这些反应分为七类。我们由反应物 和产物的结构衍生了反应物,产物和化学反应的 MOLMAP 指数,其中化合物的结构由 化学键的物理化学性质和拓扑性质所表征。通过随机森林建立了三种类型的模型:(1)预 测反应物可能发生的反应类型;(2)预测可能合成产物的反应类型;(3)预测整个化学反 应的类型。对比此前同一数据集的研究,表明改进化学键的描述有助于提高 MOLMAP 指数的预测能力。为了得到更稳定和准确的模型,通过 weka 进行了化学键的物理化学 性质和拓扑性质的变量选择。变量选择后,化学键性质的子集用于生成 MOLMAP 指数。 同时还进行了被选子集性能的评价。
2. 生物代谢反应分类预测研究
生物代谢反应的数据集来源于 KEGG LIGAND 数据库。这些反应分为六类,其中 的一类为水解酶催化的化学反应。本章的数据集由 619 个水解酶催化的化学反应所组
成。这些反应被进一步分为八个子类。由于逆反应也被包含,共得到 1238 个代谢反应。 通过随机森林,由化学反应的 MOLMAP 指数,自动地预测了化学反应分类。此外,采 用 weka,也对生成 MOLMAP 指数的化学键性质进行了变量选择。变量选择的研究仍 在进行中。
I
关键词:分子映射指数,光化学反应分类,生物代谢反应分类,变量选择
II
ABSTRACT
The automatic classification of chemical reactions is essential for the analysis of reaction databases, especially for metabolic reactions. Some researches have been implemented based on the identification of the reaction center in this area. However, information of reaction centers are not available in most of databases, and the applications of these methods are limited.
MOLMAP (molecular maps of atom-level properties) descriptor of chemical reaction is the difference between MOLMAP descriptors of products and MOLMAP descriptors of the reactants. The descriptor is achieved without previous assignment of the reaction center, and it has potential to be used widely. In this thesis we studied photochemical reactions and metabolic reactions by using MOLMAP descriptors of chemical reactions.
Studies on classification of photochemical reactions
The data set composed of 356 photochemcial reactions was extracted from the SPRESI database (InfoChem GmbH, Munich, Germany) and each reaction consisted of two reactants and one product. These rea
文档评论(0)