抗胰腺癌候选药物的优化建模.pdfVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2021年中国研究生数学建模竞赛D题

抗乳腺癌候选药物的优化建模

一、背景介绍

乳腺癌是目前世界上最常见,致死率较高的癌症之一。乳腺癌的发展与雌激

素受体密切相关,有研究发现,雌激素受体α亚型(Estrogenreceptorsalpha,ERα)

在不超过10%的正常乳腺上皮细胞中表达,但大约在50%-80%的乳腺肿瘤细胞

中表达;而对ERα基因缺失小鼠的实验结果表明,ERα确实在乳腺发育过程中

扮演了十分重要的角色。目前,抗激素治疗常用于ERα表达的乳腺癌患者,其

通过调节雌激素受体活性来控制体内雌激素水平。因此,ERα被认为是治疗乳腺

癌的重要靶标,能够拮抗ERα活性的化合物可能是治疗乳腺癌的候选药物。比

如,临床治疗乳腺癌的经典药物他莫昔芬和雷诺昔芬就是ERα拮抗剂。

目前,在药物研发中,为了节约时间和成本,通常采用建立化合物活性预测

模型的方法来筛选潜在活性化合物。具体做法是:针对与疾病相关的某个靶标(此

处为ERα),收集一系列作用于该靶标的化合物及其生物活性数据,然后以一系

列分子结构描述符作为自变量,化合物的生物活性值作为因变量,构建化合物的

定量结构-活性关系(QuantitativeStructure-ActivityRelationship,QSAR)模型,然

后使用该模型预测具有更好生物活性的新化合物分子,或者指导已有活性化合物

的结构优化。

一个化合物想要成为候选药物,除了需要具备良好的生物活性(此处指抗乳

腺癌活性)外,还需要在人体内具备良好的药代动力学性质和安全性,合称为

ADMET(Absorption吸收、Distribution分布、Metabolism代谢、Excretion排泄、

Toxicity毒性)性质。其中,ADME主要指化合物的药代动力学性质,描述了化

合物在生物体内的浓度随时间变化的规律,T主要指化合物可能在人体内产生的

毒副作用。一个化合物的活性再好,如果其ADMET性质不佳,比如很难被人体

吸收,或者体内代谢速度太快,或者具有某种毒性,那么其仍然难以成为药物,

因而还需要进行ADMET性质优化。为了方便建模,本试题仅考虑化合物的5种

ADMET性质,分别是:1)小肠上皮细胞渗透性(Caco-2),可度量化合物被人

体吸收的能力;2)细胞色素P450酶(CytochromeP450,CYP)3A4亚型(CYP3A4),

这是人体内的主要代谢酶,可度量化合物的代谢稳定性;3)化合物心脏安全性

评价(humanEther-a-go-goRelatedGene,hERG),可度量化合物的心脏毒性;4)

人体口服生物利用度(HumanOralBioavailability,HOB),可度量药物进入人体后

被吸收进入人体血液循环的药量比例;5)微核试验(Micronucleus,MN),是检

测化合物是否具有遗传毒性的一种方法。

二、数据集介绍及建模目标

本试题针对乳腺癌治疗靶标ERα,首先提供了1974个化合物对ERα的生物

活性数据。这些数据包含在文件“ERα_activity.xlsx”的training表(训练集)中。

training表包含3列,第一列提供了1974个化合物的结构式,用一维线性表达式

SMILES(SimplifiedMolecularInputLineEntrySystem)表示;第二列是化合物

对ERα的生物活性值(用IC表示,为实验测定值,单位是nM,值越小代表生

50

物活性越大,对抑制ERα活性越有效);第三列是将第二列IC值转化而得的

50

pIC(即IC值的负对数,该值通常与生物活性具有正相关性,即pIC值越大

505050

表明生物活性越高;实际QSAR建模中,一般采用pIC50来表示生物活性值)。

该文件另有一个test表(测试集),里面提供有50个化合物的S

文档评论(0)

158****8359 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档