数学建模社区-数学中国
标题:
1150队C题.pdf
[打印本页]
作者:
ilikenba
时间:
2022-5-5 10:51
标题:
1150队C题.pdf
2022第十五届“SPSSPRO杯”数学中国数学建模网络挑战赛(认证赛)论文公示,敬请下载!欢迎交流!1150队C题.pdf
作者:
3023nnn
时间:
2022-5-6 17:23
虽然模型不算特别复杂,但是用得恰到好处,正好能解决题目提出的问题,符合建模比赛尽量用简单模型解决实际复杂的问题。
作者:
3023nnn
时间:
2022-5-6 17:26
而且,数据处理过程很详细,对数据的理解非常深刻且解释的很通俗易懂,同样是做C题,我感觉我们对相关名词理解远不如这篇论文所写的那么深刻,受益匪浅
作者:
yqs123
时间:
2022-5-6 17:33
这篇论文的模型虽然不算复杂,但是第一问不同于大多数队伍只考虑了人口这个因素,还把其他几个指标全部考虑入其中,是论文中的一大亮点。而且数据处理部分采用了先分类在删除数据行的方法在最大程度上减少了数据信息的丢失。第二问当中没有像很多文章中直接用回归和数据降维这些方法,而是先考虑各自变量之间的相关性后再进行建模,恰当合理,充分考虑了实际问题的背景,而不是对各类模型进行生搬硬套。
作者:
lr0922
时间:
2022-5-6 21:17
该篇论文针对问题一没有像其他论文一样以州单位增设采样点,而是认为数据集中的每一行代表一个下水道id,而每一个下水道id对应着多个采样点。看完论文之后,我发现我们之前做题的想法过于简单,简单的认为每一行就是对应一个采样点
作者:
lr0922
时间:
2022-5-6 21:29
简单的认为每行数据这种想法我之前一直感觉颇为合理,但是看完这篇论文之后,我感觉这种想法颇为荒谬,毕竟数据集中部分行id都是相同的,一行代表一个采样点id的说法显然说不通。而且,翻译过来的意思也是下水道id,而非采样点ID
作者:
lr0922
时间:
2022-5-6 21:38
而该篇论文不仅区分了下水道ID和采样点ID,并且对同一个下水道ID对应一个采样点ID和多个采样点ID都进行了分类考虑,并分别进行了数据处理,对数据的理解能力不可谓不深
作者:
lr0922
时间:
2022-5-6 21:45
特别是在读完论文之后,我又去重新读了一遍之前一直忽视的数据集下面的注释部分,发现原来各列数据含义并不是表面上那么简单,每列数据都有着其独特的含义。做题过程中我一直困惑于为何会有某些数值极其巨大的数据存在,甚至达到了10的9次方,10次方的量级。
作者:
lr0922
时间:
2022-5-6 21:51
读完论文之后,我突然明白了,之所以出现这种数据,是因为这列数据代表的是该次测试样本中的病毒含量比上上次病毒的含量,而病毒的含量可能会出现上次病毒的含量极低,几乎没有,而这次检测存在少数病毒也会使得这个比例极大。在官方网站给出的注释里面也提到了这点,说该列数据数值较大并不能代表病毒数量就非常多。
作者:
lr0922
时间:
2022-5-6 22:38
而该篇论文对于这种数值异常大所在列的数据处理更是角度十分独特,并没有像其他论文一样一股脑把所有列数据全部使用,而是只选取了其他几列无极端值的列作为考虑因素。而把该篇论文把存在极端值的所在列作为检验列,对挑选出来的最佳采样点的合理性进行再判断,既没有浪费数据集中的信息,又避免了极端数据对结果造成巨大影响的情况出现,确实非常巧妙
作者:
tyymqq
时间:
2022-5-7 10:39
论文对于每列数据中的“N/A”和“0”数据都做出了详细的解释,并根据每列数据特殊值的含义进行了不同的处理。而且,考虑到了不同列的“N/A”有重合的部分,某一列数据中为“N/A”,则对应的行中另一列数据中也一定是“N/A”这种情况,也是我在阅读其他论文时没有发现提到过的。该篇论文对数据的处理的细致和详细十分值得学习,我也一直认为数据处理是建模的基础,只有弄清楚了数据的含义,才能建立合适的模型来解决问题。
作者:
tyymqq
时间:
2022-5-7 23:15
通过这篇论文,也让我明白并不是模型做的越复杂才是好的模型,真正好的建模应该是用最简单易行的模型来解决实际复杂的问题,对于模糊的地方就应该大胆假设掉,不要钻无谓的牛角尖,解决问题才是最重要的。
作者:
tyymqq
时间:
2022-5-8 10:04
整体来看,感觉这篇论文比其他的论文考虑的要全面很多,对数据的处理非常值得学习
作者:
lr0922
时间:
2022-5-9 08:57
该篇论文根据模型需要构造的“合理性指标”在保证模型准确的前提下,尽最大可能的保留了题目所给的信息,没有生搬硬套已有的模型和算法,很符合建模比赛的初衷,非常值得学习
作者:
lr0922
时间:
2022-5-9 16:32
建模比赛就是想用最简单易行的模型解决复杂的实际问题,该篇论文构造的“合理性”指标虽然不复杂但是实用性和准确性很高,对于解决实际问题有着重要意义
作者:
1827846396
时间:
2022-8-3 08:40
66666666666666666666666
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5