12 / 2 页下一页

返回列表

查看: 2263|回复: 15

[C题] 1150队C题.pdf

[复制链接]

字体大小: 正常放大

ilikenba

1万主题	49 听众	2万积分

TA的每日心情

	奋斗 2024-6-23 05:14

签到天数: 1043 天

[LV.10]以坛为家III

群组: 万里江山

群组: sas讨论小组

群组: 长盛证券理财有限公司

群组: C 语言讨论组

群组: Matlab讨论组

电梯直达

1^#

发表于 2022-5-5 10:51 |只看该作者 |倒序浏览

|招呼Ta 关注Ta

2022第十五届“SPSSPRO杯”数学中国数学建模网络挑战赛（认证赛）论文公示，敬请下载！欢迎交流！1150队C题.pdf

本帖子中包含更多资源

您需要登录才可以下载或查看，没有帐号？注册地址

点评

小徐吃不饱论文逻辑缜密，思维清晰，很好的展示了要解决的问题。发表于 2022-5-7 00:00

zan

转播0 淘帖0 分享0 收藏0 支持0 反对0 微信

使用道具举报

3023nnn

0 主题	1 听众	115 积分

升级 7.5%

TA的每日心情

	衰 2022-4-4 12:36

签到天数: 1 天

[LV.1]初来乍到

自我介绍: 我来自济宁，是泰山学院数学与统计学院数据科学与大数据技术专业一名大二本科生

2^#

发表于 2022-5-6 17:23 手机频道 |只看该作者 |招呼Ta 关注Ta

虽然模型不算特别复杂，但是用得恰到好处，正好能解决题目提出的问题，符合建模比赛尽量用简单模型解决实际复杂的问题。

点评回复

使用道具举报

3023nnn

0 主题	1 听众	115 积分

升级 7.5%

TA的每日心情

	衰 2022-4-4 12:36

签到天数: 1 天

[LV.1]初来乍到

自我介绍: 我来自济宁，是泰山学院数学与统计学院数据科学与大数据技术专业一名大二本科生

3^#

发表于 2022-5-6 17:26 手机频道 |只看该作者 |招呼Ta 关注Ta

而且，数据处理过程很详细，对数据的理解非常深刻且解释的很通俗易懂，同样是做C题，我感觉我们对相关名词理解远不如这篇论文所写的那么深刻，受益匪浅

点评回复

使用道具举报

yqs123

0 主题	3 听众	44 积分

升级 41.05%

TA的每日心情

	慵懒 2022-4-9 15:55

签到天数: 1 天

[LV.1]初来乍到

自我介绍: 泰山学院学生

4^#

发表于 2022-5-6 17:33 手机频道 |只看该作者 |招呼Ta 关注Ta

这篇论文的模型虽然不算复杂，但是第一问不同于大多数队伍只考虑了人口这个因素，还把其他几个指标全部考虑入其中，是论文中的一大亮点。而且数据处理部分采用了先分类在删除数据行的方法在最大程度上减少了数据信息的丢失。第二问当中没有像很多文章中直接用回归和数据降维这些方法，而是先考虑各自变量之间的相关性后再进行建模，恰当合理，充分考虑了实际问题的背景，而不是对各类模型进行生搬硬套。

点评回复

使用道具举报

lr0922

0 主题	3 听众	53 积分

升级 50.53%

该用户从未签到

自我介绍: 泰山学院学生

5^#

发表于 2022-5-6 21:17 手机频道 |只看该作者 |招呼Ta 关注Ta

该篇论文针对问题一没有像其他论文一样以州单位增设采样点，而是认为数据集中的每一行代表一个下水道id，而每一个下水道id对应着多个采样点。看完论文之后，我发现我们之前做题的想法过于简单，简单的认为每一行就是对应一个采样点

点评回复

使用道具举报

lr0922

0 主题	3 听众	53 积分

升级 50.53%

该用户从未签到

自我介绍: 泰山学院学生

6^#

发表于 2022-5-6 21:29 手机频道 |只看该作者 |招呼Ta 关注Ta

简单的认为每行数据这种想法我之前一直感觉颇为合理，但是看完这篇论文之后，我感觉这种想法颇为荒谬，毕竟数据集中部分行id都是相同的，一行代表一个采样点id的说法显然说不通。而且，翻译过来的意思也是下水道id，而非采样点ID

点评回复

使用道具举报

lr0922

0 主题	3 听众	53 积分

升级 50.53%

该用户从未签到

自我介绍: 泰山学院学生

7^#

发表于 2022-5-6 21:38 手机频道 |只看该作者 |招呼Ta 关注Ta

而该篇论文不仅区分了下水道ID和采样点ID，并且对同一个下水道ID对应一个采样点ID和多个采样点ID都进行了分类考虑，并分别进行了数据处理，对数据的理解能力不可谓不深

点评回复

使用道具举报

lr0922

0 主题	3 听众	53 积分

升级 50.53%

该用户从未签到

自我介绍: 泰山学院学生

8^#

发表于 2022-5-6 21:45 手机频道 |只看该作者 |招呼Ta 关注Ta

特别是在读完论文之后，我又去重新读了一遍之前一直忽视的数据集下面的注释部分，发现原来各列数据含义并不是表面上那么简单，每列数据都有着其独特的含义。做题过程中我一直困惑于为何会有某些数值极其巨大的数据存在，甚至达到了10的9次方，10次方的量级。

点评回复

使用道具举报

lr0922

0 主题	3 听众	53 积分

升级 50.53%

该用户从未签到

自我介绍: 泰山学院学生

9^#

发表于 2022-5-6 21:51 手机频道 |只看该作者 |招呼Ta 关注Ta

读完论文之后，我突然明白了，之所以出现这种数据，是因为这列数据代表的是该次测试样本中的病毒含量比上上次病毒的含量，而病毒的含量可能会出现上次病毒的含量极低，几乎没有，而这次检测存在少数病毒也会使得这个比例极大。在官方网站给出的注释里面也提到了这点，说该列数据数值较大并不能代表病毒数量就非常多。

点评回复

使用道具举报

lr0922

0 主题	3 听众	53 积分

升级 50.53%

该用户从未签到

自我介绍: 泰山学院学生

10^#

发表于 2022-5-6 22:38 手机频道 |只看该作者 |招呼Ta 关注Ta

而该篇论文对于这种数值异常大所在列的数据处理更是角度十分独特，并没有像其他论文一样一股脑把所有列数据全部使用，而是只选取了其他几列无极端值的列作为考虑因素。而把该篇论文把存在极端值的所在列作为检验列，对挑选出来的最佳采样点的合理性进行再判断，既没有浪费数据集中的信息，又避免了极端数据对结果造成巨大影响的情况出现，确实非常巧妙

点评回复

使用道具举报

12 / 2 页下一页

返回列表

帐号		密码		只需要一步，快速开始		注册地址	找回密码

[C题] 1150队C题.pdf

本帖子中包含更多资源

点评

浏览过的版块

社区QQ达人

新人进步奖

优秀斑竹奖

发帖功臣

QQ

电话咨询

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务|