QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 1818|回复: 15
打印 上一主题 下一主题

[C题] 1150队C题.pdf

[复制链接]
字体大小: 正常 放大
ilikenba 实名认证       

1万

主题

49

听众

2万

积分

  • TA的每日心情
    奋斗
    2024-6-23 05:14
  • 签到天数: 1043 天

    [LV.10]以坛为家III

    社区QQ达人 新人进步奖 优秀斑竹奖 发帖功臣

    群组万里江山

    群组sas讨论小组

    群组长盛证券理财有限公司

    群组C 语言讨论组

    群组Matlab讨论组

    跳转到指定楼层
    1#
    发表于 2022-5-5 10:51 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    2022第十五届“SPSSPRO杯”数学中国数学建模网络挑战赛(认证赛)论文公示,敬请下载!欢迎交流!1150队C题.pdf

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?注册地址

    点评

    小徐吃不饱  论文逻辑缜密,思维清晰,很好的展示了要解决的问题。  发表于 2022-5-7 00:00
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    3023nnn        

    0

    主题

    1

    听众

    115

    积分

    升级  7.5%

  • TA的每日心情

    2022-4-4 12:36
  • 签到天数: 1 天

    [LV.1]初来乍到

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    我来自济宁,是泰山学院数学与统计学院数据科学与大数据技术专业一名大二本科生
    虽然模型不算特别复杂,但是用得恰到好处,正好能解决题目提出的问题,符合建模比赛尽量用简单模型解决实际复杂的问题。
    点评回复

    使用道具 举报

    3023nnn        

    0

    主题

    1

    听众

    115

    积分

    升级  7.5%

  • TA的每日心情

    2022-4-4 12:36
  • 签到天数: 1 天

    [LV.1]初来乍到

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    我来自济宁,是泰山学院数学与统计学院数据科学与大数据技术专业一名大二本科生
    而且,数据处理过程很详细,对数据的理解非常深刻且解释的很通俗易懂,同样是做C题,我感觉我们对相关名词理解远不如这篇论文所写的那么深刻,受益匪浅
    点评回复

    使用道具 举报

    yqs123        

    0

    主题

    3

    听众

    44

    积分

    升级  41.05%

  • TA的每日心情
    慵懒
    2022-4-9 15:55
  • 签到天数: 1 天

    [LV.1]初来乍到

    网络挑战赛参赛者

    自我介绍
    泰山学院学生
    这篇论文的模型虽然不算复杂,但是第一问不同于大多数队伍只考虑了人口这个因素,还把其他几个指标全部考虑入其中,是论文中的一大亮点。而且数据处理部分采用了先分类在删除数据行的方法在最大程度上减少了数据信息的丢失。第二问当中没有像很多文章中直接用回归和数据降维这些方法,而是先考虑各自变量之间的相关性后再进行建模,恰当合理,充分考虑了实际问题的背景,而不是对各类模型进行生搬硬套。
    点评回复

    使用道具 举报

    lr0922        

    0

    主题

    3

    听众

    53

    积分

    升级  50.53%

    该用户从未签到

    网络挑战赛参赛者

    自我介绍
    泰山学院学生
    该篇论文针对问题一没有像其他论文一样以州单位增设采样点,而是认为数据集中的每一行代表一个下水道id,而每一个下水道id对应着多个采样点。看完论文之后,我发现我们之前做题的想法过于简单,简单的认为每一行就是对应一个采样点
    点评回复

    使用道具 举报

    lr0922        

    0

    主题

    3

    听众

    53

    积分

    升级  50.53%

    该用户从未签到

    网络挑战赛参赛者

    自我介绍
    泰山学院学生
    简单的认为每行数据这种想法我之前一直感觉颇为合理,但是看完这篇论文之后,我感觉这种想法颇为荒谬,毕竟数据集中部分行id都是相同的,一行代表一个采样点id的说法显然说不通。而且,翻译过来的意思也是下水道id,而非采样点ID
    点评回复

    使用道具 举报

    lr0922        

    0

    主题

    3

    听众

    53

    积分

    升级  50.53%

    该用户从未签到

    网络挑战赛参赛者

    自我介绍
    泰山学院学生
    而该篇论文不仅区分了下水道ID和采样点ID,并且对同一个下水道ID对应一个采样点ID和多个采样点ID都进行了分类考虑,并分别进行了数据处理,对数据的理解能力不可谓不深
    点评回复

    使用道具 举报

    lr0922        

    0

    主题

    3

    听众

    53

    积分

    升级  50.53%

    该用户从未签到

    网络挑战赛参赛者

    自我介绍
    泰山学院学生
    特别是在读完论文之后,我又去重新读了一遍之前一直忽视的数据集下面的注释部分,发现原来各列数据含义并不是表面上那么简单,每列数据都有着其独特的含义。做题过程中我一直困惑于为何会有某些数值极其巨大的数据存在,甚至达到了10的9次方,10次方的量级。
    点评回复

    使用道具 举报

    lr0922        

    0

    主题

    3

    听众

    53

    积分

    升级  50.53%

    该用户从未签到

    网络挑战赛参赛者

    自我介绍
    泰山学院学生
    读完论文之后,我突然明白了,之所以出现这种数据,是因为这列数据代表的是该次测试样本中的病毒含量比上上次病毒的含量,而病毒的含量可能会出现上次病毒的含量极低,几乎没有,而这次检测存在少数病毒也会使得这个比例极大。在官方网站给出的注释里面也提到了这点,说该列数据数值较大并不能代表病毒数量就非常多。
    点评回复

    使用道具 举报

    lr0922        

    0

    主题

    3

    听众

    53

    积分

    升级  50.53%

    该用户从未签到

    网络挑战赛参赛者

    自我介绍
    泰山学院学生
    而该篇论文对于这种数值异常大所在列的数据处理更是角度十分独特,并没有像其他论文一样一股脑把所有列数据全部使用,而是只选取了其他几列无极端值的列作为考虑因素。而把该篇论文把存在极端值的所在列作为检验列,对挑选出来的最佳采样点的合理性进行再判断,既没有浪费数据集中的信息,又避免了极端数据对结果造成巨大影响的情况出现,确实非常巧妙
    点评回复

    使用道具 举报

    高级模式
    B Color Image Link Quote Code Smilies

    qq
    收缩
    • 电话咨询

    • 04714969085

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-6-16 18:34 , Processed in 0.577738 second(s), 85 queries .

    回顶部