数学建模社区-数学中国
标题: 华为杯数学建模,2021D题(数模之星),乳腺癌,机器学习,数据分析 [打印本页]
作者: 2744557306 时间: 2023-8-21 15:27
标题: 华为杯数学建模,2021D题(数模之星),乳腺癌,机器学习,数据分析
最近在github找到一篇2021年D题(抗乳腺癌候选药物的优化建模)一等奖的资源,内容公开,链接如下:GitHub - DongZhouGu/MathModel-Pretrain: 研究生数学建模,华为杯数学建模,2021D题(数模之星),乳腺癌,机器学习,数据分析" {! b0 ?' ^( w" o9 L0 }5 \: B
具体论文的代码在数模之星文件夹中,该博主是上海大学的,里面包含他答辩的ppt和论文,代码以及所使用到的数据。相当详细。& f5 w- N7 o, d* m% a0 N$ Q X
当然上不去github的同学可以下载我们附件中的内容,也是可以学习的。附件内容如下:附件初始设定为5点体力值- R0 f) W7 T7 u2 j: Z
! i& \: X! @! B/ G* W* }下面我们介绍一下题目:4 P$ T# \+ e' L0 r& Y1 ]
已有条件:
给出了1974个训练样本和50个测试样本,每个样本有729个特征
- 每个训练样本有7个标签,分别是IC50值、pIC50值、和ADMET性质(包含5个标签)
- IC50值、pIC50值是两个相关的连续变量。pIC50是IC50的负对数
- ADMET性质的五个变标签都是布尔值
9 g) M( _: x+ t9 K) w1 P
问题:
- 根据特征对IC50值和pIC50值影响的重要性进行排序,并给出前20个对IC50值和pIC50值最具有显著影响的特征
- 选择不超过20个特征,构建IC50值和pIC50值的定量预测模型,并计算测试样本的IC50值和pIC50值。
- 构建ADMET性质的分类预测模型,并计算测试样本的ADMET性质
- 寻找并阐述哪些特征,以及这些特征在什么取值范围时,pIC50值取值较好,同时具有更好的ADMET性质(给定的五个ADMET性质中,至少三个性质较好)! z i @- g6 e* H2 A" G2 J% v
对于题目的理解大家可以看附件中的论文,肯定要比我理解深刻。希望大家可以学到知识。
& r- X4 R2 u# d9 Q附件如下3 `7 U# t4 a. B4 U& E3 A& k8 C0 Y
& w) s$ k0 ?. p! h: ]
- j" i9 b0 E+ t7 p
-
12.jpg
(52.48 KB, 下载次数: 50)
-
-
数模之星.rar
35.28 MB, 下载次数: 4, 下载积分: 体力 -2 点
售价: 5 点体力 [记录]
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) |
Powered by Discuz! X2.5 |