【研究生数学建模】抗乳腺癌候选药物的优化建模.pdf

【研究生数学建模】抗乳腺癌候选药物的优化建模.pdf

  1. 1、本文档共65页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中国研究生创新实践系列大赛 中国研究生创新实践系列大赛 “华为杯”第十八届中国研究生 “华为杯”第十八届中国研究生 数学建模竞赛 数学建模竞赛 学 校 山西大学 参赛队号 21101080006 1. 祝海峰 队员姓名 2. 陈庆辉 3. 孟颖岫 0 中国研究生创新实践系列大赛 中国研究生创新实践系列大赛 “华为杯”第十八届中国研究生 “华为杯”第十八届中国研究生 数学建模竞赛 数学建模竞赛 题 目 抗乳腺癌候选药物的优化建模 摘 要 : ERα 乳腺癌是目前世界上最常见,致死率较高的癌症之一。 被认为是治疗乳腺癌的重 要靶标,能够拮抗ERα活性的化合物可能是治疗乳腺癌的候选药物。本文在保证了ADMET 性质优越的情况下建立了化合物活性预测模型,来确定影响化合物活性的主要分子描述符 及其取值范围,为生产中抗乳腺癌化合物的选择提供理论依据。 针对第一问,筛选出影响生物活性最显著的20个分子描述符。首先,本文对数据进 行了预处理:将含0 比例大于90%的特征剔除,剔除了344 个特征;用拉依达准则对剩余 100 26 数据进行异常检测,剔除异常值数量在 以上的特征,有 个特征被剔除;对于异常 值数量在100 以内的特征,将异常值进行限幅。然后,把pIC50 作为因变量,用随机森林 359 30 30 和熵值法对剩余 个特征进行分析,分别筛选出 个主要变量,并分别画出二者 个 变量的相关性图,对比发现随机森林筛选的特征更具有代表性。接着,对随机森林筛选的 30个变量进行Pearson 相关性分析,将强关系的变量进行逐一剔除,最终获得影响生物活 性的20个主要变量。 针对第二问,构建化合物对ERα生物活性的定量回归预测模型。首先,以pIC50 为因 20 变量,第一问筛选的 个变量作为自变量,建立支持向量机、神经网络、梯度提升和随 机森林的回归预测模型,并用随机有哪些信誉好的足球投注网站方法有哪些信誉好的足球投注网站四种模型的最佳超参数。然后,用MAE、 RMSE 和拟合度3个评价指标对四种模型进行评价,并画出四种模型对测试集前20 组数据 实际值和预测值的拟合图,观察发现随机森林效果最佳。最后,用随机森林预测题目中给 的50 组化合物的pIC50,并通过公式求解出IC50_nM。 针对第三问,分别构建五种化合物的分类预测模型。首先,使用第一问中数据预处理 359 之后剩余的 个特征数据作为自变量,五个化合物的二分类数据作为因变量。然后,构 建五种化合物的四个二分类模型:支持向量机、随机梯度下降、神经网络和随机森林。以 ROC、AUC 和准确率作为模型评价标准,用随机有哪些信誉好的足球投注网站对五个化合物分类模型分别进行最佳 超参数有哪些信誉好的足球投注网站,最终发现随机森林对五种化合物的分类效果均优于其他模型。确定使用随机

文档评论(0)

187****3326 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档