QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 59530|回复: 49
打印 上一主题 下一主题

【数学中国原创】2014 MCM 赛题评注补充之——ICM试题解析

[复制链接]
字体大小: 正常 放大
magic2728 实名认证    中国数模人才认证   

61

主题

478

听众

4861

积分

升级  95.37%

  • TA的每日心情
    慵懒
    2014-9-29 19:37
  • 签到天数: 409 天

    [LV.9]以坛为家II

    群组数学中国 2015美赛护航

    群组数模专题强化培训

    群组建模思维养成培训

    群组2015美赛护航(强化)

    群组2013年数学建模国赛备

    跳转到指定楼层
    1#
    发表于 2014-2-24 20:22 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    2014 MCM 赛题评注补充之——ICM试题解析
    今年美赛赛后,算是对数学中国会员的一个回馈,有兴趣花了点时间就AB题的相关要点进行了分析,并提出了主流的思路方法,也算是对今年比赛的一个总结,与大家一起讨论交流和提高,没想到反响甚好,有不少同学提出想要继续查看C题的相关评注内容,我本今年没有关注ICM的题目,但盛情难却,近日研读此题,写下此文,供同学们参考与批评。
    此题继承了以往ICM试题的特点,内容较长,题目类型往往没有一个特定的学科可以涵盖,建立的模型通常用在非常实际的领域或者是跨学科领域,用却是同一个模型,同一套思路,体现了数学建模在交叉学科应用中巧妙而美丽的应用。本题题干较长,相关概念被反复提及,建议多阅读几遍,然后总结出题目要求,进而根据自己的经验积累建模,我仍然按照《2014 MCM 赛题评注与解析》中提到的题目信息标注法,对题目信息进行相关标注,然后给出参考思路。
    2014 ICM Problem
    Using Networks to Measure Influence and Impact (bk1: theme of the whole)
    One of the techniques to determine influence of academic research is to build and measureproperties of citation or co-author networks. (bk1': supplementary explanation of restriction)
    Co-authoring a manuscriptusually connotes a stronginfluential connection between researchers. (bk1'': co-author'simportance)
    One of the most famous academicco-authors was the 20th-centurymathematician Paul Erdös who had over 500 co-authors and published over 1400 technical researchpapers. (bk2: introduction of Paul Erdös)
    It is ironic, or perhaps not, thatErdös is also one of the influencers in building the foundation for theemerging interdisciplinaryscience of networks, particularly, through his publication with Alfred Rényi of the paper “On Random Graphs” in 1959. (pro1: theirrationality of evaluation to Paul)
    Erdös’s role as a collaborator was so significant in the field of mathematics thatmathematicians often measure their closeness toErdös through analysis of Erdös’s amazingly large and robust co-author network (see the website http://www.oakland.edu/enp/). (pro1': the huge effect of Paul)
    The unusual and fascinating story of PaulErdös as a gifted mathematician, talented problem solver, and master collaborator is provided in many books and on-linewebsites (e.g., http://www-history.mcs.st-and.ac.uk/Biographies/Erdos.html).(pro1'': also thehuge effect of Paul)
    Perhaps his itinerant lifestyle,frequently staying with or residing with his collaborators, and giving much ofhis money to students asprizes for solving problems, enabled his co-authorships to flourish and helped build his astounding network of influencein several areas of mathematics. (trying to answer the question)
    In order to measure such influence as Erdös produced, there arenetwork-based evaluation tools that use co-author and citation data to determineimpact factor of researchers,publications, and journals. (bk3: evaluationmethod has existed)
    Some of these are Science Citation Index, Hfactor, Impact factor, Eigenfactor, etc. Google Scholar isalso a good data tool to use for networkinfluence or impact data collection and analysis. (bk3': examples of theevaluation method)
    Your team’s goal for ICM 2014 is toanalyze influence and impact in researchnetworks and other areas of society. (spms &msss)
    Your tasks to do this include:
    1) Build the co-author network of the Erdos1 authors (you canuse the file from the website https://files.oakland.edu/users/grossman/enp/Erdos1.htmlor the one we include at Erdos1.htm ). (spm1: networkto be constructed)
    You should build a co-author network of the approximately 510 researchers from the file Erdos1,who coauthored a paper with Erdös,but do not include Erdös. (imp1: the network graph should not include the nodePaul)
    This will take some skilled data extraction and modeling efforts to obtain the correct set of nodes(the Erdös coauthors) and their links(connections with one another as co-authors). (imp2: nodes& links' meaning in the model has been presented)
    There are over 18,000 lines of rawdata in Erdos1 file, but many of them will not be used since they are links to people outside the Erdos1 network. (imp3: thefeature of the network)
    If necessary, you can limit the size of your network to analyze in order to calibrate yourinfluence measurement algorithm. (imp3': one wayto deal with the problem, also a characteristic)
    Once built, analyze the properties of this network. (Again, do not include Erdös --- he is the most influential and wouldbe connected to all nodes in the network.In this case, it’s co-authorship with him that builds the network, but he is not part of the network or the analysis.) (mss1: evaluatethe property of network, as part of spm1, also remove Paul himself to simplifyit)
    2) Develop influence measure(s) to determine who in this Erdos1 network has significant influence within the network. (mss2: present oneof the result of the model, as part of spm1)
    Consider who has published important works or connects important researchers withinErdos1. Again, assume Erdös is not there toplay these roles. (mss2': present the result of the model)
    3) Another type of influence measure might be to compare thesignificance of a research paper byanalyzing the important works that follow from its publication. (imp4: anotherway of modeling)
    Choose some set of foundational papers in the emerging field of networkscience either from theattached list (NetSciFoundation.pdf)or papers you discover. (imp4':information of the thought)
    Use these papers to analyze and develop a model to determinetheir relative influence. (spm2: new modelunder new conditions)
    Build the influence (coauthor or citation) networks and calculate appropriate measures for your analysis. (mss3: newevaluation way, part of spm2)
    Which of the papers in your set do you consider is the most influential in network scienceand why? (mss4: the result of spm2)
    Is there a similar way todetermine the role or influence measure of an individual network researcher? Consider how you would measure the role,influence, or impact of a specificuniversity, department, or a journal in network science? Discuss methodology to develop such measures and the datathat would need to be collected. (mss5: theprolongation & evaluation of spm2)
    4) Implement your algorithm on a completely different set of networkinfluence data --- for instance,influential songwriters, music bands, performers, movie actors, directors, movies, TV shows, columnists, journalists,newspapers, magazines, novelists,novels, bloggers, tweeters, or any data set you care to analyze. (mss6: application of the network of spm1 & 2 toother field)
    You may wish to restrictthe network to a specific genre or geographic location or predetermined size. (imp5: somerestrictions of the model to simplify it)
    5) Finally, discuss the science, understanding and utility of modelinginfluence and impact withinnetworks. (mss7: the discussion of the model)
    Could individuals, organizations, nations, and society use influence methodology to improve relationships,conduct business, and make wisedecisions? (mss7': theresult of the discussion)
    For instance, at the individual level, describe how you could use your measures and algorithms to choose who to try toco-author with in order to boost yourmathematical influence as rapidly as possible. (mss7'': instance toexplain it)
    Or how can you use your modelsand results to help decide on a graduate school or thesis advisor to select for your future academic work? (mss7''':another instance)
    6) Write a report explaining your modeling methodology, your network-based influence and impact measures, and your progress and results for the previous five tasks. (final mission to combine all the results)
    The report must not exceed 20 pages (not including your summary sheet) and should present solid analysis of your network data; strengths, weaknesses, and sensitivity of your methodology; andthe power of modeling these phenomenausing network science. (imp6: allthe contents that should be included in the paper)
    *Your submission should consist of a 1 page SummarySheet and your solution cannot
    exceed 20 pages for a maximum of 21 pages.
    仔细阅读完上面的题目级标注,可以看出本题一共有两个主体模型:1,2两问基于以Paul为中心的合作者网络进而评价除Paul以外的作者在一个学科的影响力的程度;3,4,5基于题目中间列出的文章列表为中心,构建评价网络,进而对网络里面的对象或者是他们的集合(比如文章和期刊,还有写了很多文章的作者)进行评价。在每个模型后面都有若干具体的问题,都是基于以上两个网络提出的,有的是构建评价方案,有的是要评价结果,还有的是模型数据的改变进而拓展等等。下文谈谈这两个网络的构建,再聊这些问题给我们建模的要求和暗示。
    Model1
    数据显示了511个与Paul有过合作的作者与除Paul之外的作者合作的情况,共511个条目。按题目意思,我们需要建立图论模型,顶点就是这些作者,且如果他们之间有合作过,那么他们之间存在边。此图的顶点数本来为:1+511+X1PaulX是那些度为1的点,在题中没有给出相关数据,如果全纳入,依题意将会有18000条边,所以建议的化简方法是只留下511顶点,1毫无疑问是度最高,Paul影响力也是最大的,X则只有一次合作,太次不用考虑。
    数据提取方法大家可以尝试matlab或者Perl等语言的正则表达式匹配来提取相关信息。
    网络建立好后,粗略来看,每个顶点的度就是对应作者的合作次数了,拿这个数就可以评价作者的影响力了。复杂点的方法可以是设第i个作者的得分是Si,有:
    Si =ΣSjj取所有与i相邻的顶点
    (这里只是提示,表达式可以更复杂些,如平方平均等等)
    然后共511Si值,511个方程,寻找一个定义域内的解就可以了。
    (这里用到的是方程的思想来求得分值,脱胎于工程电路分析中间的基尔霍夫电流/电压定律,他在用方程思想求电压电流值!)
    网络性质可以把顶点,边的个数,回路情况,稀疏状况,顶点度的分布列出来,注意一点,就是随时关注图的实际意义和图论理论概念之间的联系,有没有关联的涵义,可以直接应,发现了就是亮点!
    Model2
    网络的中心不再是Paul,而是几篇核心的文章,这时,新网络的中心就有多种选择了,可以是这几篇文章,也可以是这几篇文章中的作者,或者这几位作者已经形成的网络中心。而真正要评价的普通论文和作者却在这个网络之外,我们对他们的评价就基于这些论文和作者与核心网络的联系程度。这里计算得分的思路和上一个模型类似,要么直接求和计算,要么用方程思想,只是,这里涉及到核心网络和外层两层网络,个人觉得简化处理外层网络是良策,否则与前一问的模型区别不大。3问最后要求给出评论结果,并将模型拓展至其他评价,只要本模型搭建完整,这个部分水到渠成,换汤不换药。
    在第4问中,用的仍然是本模型的网络思想,只是核心网络部分数据需要自己收集,另外,外围网络也一样,拓展面更大些了,但是模型仍然是一样的。
    5问中提到,既然有了我们给出的网络以及对应的评价方法,那么如何顺应这个方法来提高自己的影响力呢?分析下我们的评价表达式就知道,尽量与已经得分高的作者合作,多与人合作都能够提高自身的提升排名的效率,进而帮助决策,在具体的模型中,这一部分还应该更加量化些。
    6问要求写一个总结报告,里面提到的点也正是本题建模关键点,重述一下:
    1. 网络搭建方法:顶点代表什么,边以及其权重的涵义;
    2. 基于网络的评价方案:评价数据必须能从网络中读取,基本的想法有两个,一个是直接计算,另外一个是方程思想解之;
    3. 对前面题干中提到问题的回答,包括评分结果,发表文章策略等等。
    本题按分类算评价问题,网络搭建是建模技术考察的重点,希望大家能从这两点中有所提高,谢谢大家关注本系列文章,再见!

    zan
    转播转播0 分享淘帖0 分享分享1 收藏收藏1 支持支持0 反对反对0 微信微信
    whwraul7        

    2

    主题

    9

    听众

    207

    积分

    升级  53.5%

  • TA的每日心情
    开心
    2014-4-21 19:32
  • 签到天数: 61 天

    [LV.6]常住居民II

    我个人对此的看法:
    大部分你说出来了,但是重要的你漏了一些。
    1.网络性质结合实际的运用是你说的要强调的,但是具体用什么性质,对应什么意义,要说的合理,如果两个性质表达大部分重复的意义,或者这个意义在别的网络中比较明显,生搬过来对应,反而不好。此外,光用网络性质参数,不一定就能涵盖要分析得东西。我觉得结合一下这些作者的实际情况,反而更好。像网络中有一人是爱因斯坦的数学助手,他的网络性质得分很低,和网络内人合作得较少,但文章的水平很高,影响力很大。这种情况,就需要加其他参数来综合衡量了。
    2.用网络建模的优势何在。这应该是要强调的。既然用网络建模,那网络模型的优势在哪里?去年的o在这点做得就很出色
    3.对文章评估时,有没有某种方法可以把文章评估和作者评估联系起来?这个题目里用了很大一段话在提问,但我看你没有分析出来。这里很容易出亮点。有的人建了很多个评估模型,每个之间却缺乏联系。很容易想到的是,合作网络中的边是文章,我们评估完文章重要性后,把相应的权值赋给由文章引用和共著构成的合作网络中的边,做一个赋权网络中的作者评估,这样就能把你建的几个模型串联在一起。
    4.推广模型:这里我想到的是和12年ICM的犯罪追踪网络相似。犯罪者的交流网络相当于科学家合作网络,边代表一次对话,由对话的主题和关键词可以构成语义网络,从而给犯罪网络的边赋权,这样对应,不仅模型之间紧密联系,而且实际意义也能紧密联系
    回复

    使用道具 举报

    whwraul7        

    2

    主题

    9

    听众

    207

    积分

    升级  53.5%

  • TA的每日心情
    开心
    2014-4-21 19:32
  • 签到天数: 61 天

    [LV.6]常住居民II

    回复

    使用道具 举报

    dong8083        

    8

    主题

    12

    听众

    1500

    积分

    升级  50%

  • TA的每日心情
    奋斗
    2024-4-11 16:12
  • 签到天数: 637 天

    [LV.9]以坛为家II

    新人进步奖

    群组学术交流A

    群组学术交流B

    都说的不错。美赛又没有标准答案,仁者见仁智者见智,看结果就是了。祝大家都取得好成绩哈。
    回复

    使用道具 举报

    小左。        

    14

    主题

    40

    听众

    857

    积分

    升级  64.25%

  • TA的每日心情
    奋斗
    2015-5-4 14:45
  • 签到天数: 184 天

    [LV.7]常住居民III

    社区QQ达人

    群组数学中国2013版主团队

    群组学术交流A

    whwraul7 发表于 2014-2-24 20:55
    我个人对此的看法:
    大部分你说出来了,但是重要的你漏了一些。
    1.网络性质结合实际的运用是你说的要强调 ...

    他又没有做,你是做了的。他依然不可能考虑到所有方面,如果你对建模比较有经验就会知道,一般思路在四天里会不断修改。他只是理解题目就能做到那么多,多难得,请问你可以吗。其次,你提到的,也不过是别人用过的一些观点,没有引入真正不同学科内的交叉和创新。在我看来,也就一般。你可以看看我发的帖子,和你不一样做得B,没参加比赛。但是我用的方法全是原创的。
    回复

    使用道具 举报

    whwraul7        

    2

    主题

    9

    听众

    207

    积分

    升级  53.5%

  • TA的每日心情
    开心
    2014-4-21 19:32
  • 签到天数: 61 天

    [LV.6]常住居民II

    小左。 发表于 2014-2-25 09:17
    他又没有做,你是做了的。他依然不可能考虑到所有方面,如果你对建模比较有经验就会知道,一般思路在四天 ...

    既然没有做,那我做了的补充一点有何不可,非要把自己的观点放在肚子里?没有创意?我猜你根本就没有研究过c题的复杂网络。在下不才,研究复杂网络也一年多,论文水平虽不高,却也发了两篇核心。我不了解B题,早看过你写的了,我也感觉一般啊。自主创造指标也不见得就高明到哪里了,自己创造的指标合理性,你得说的清才行。世界发展了这么多年,牛顿力学不一样用?能把事物用最简单的模型最抓住本质的去刻画,才是数学建模的意义所在。花花肠子,看起来炫,我也能轻松的构造一大堆看起来很合理的东西,但是实际效果呢?不如把简单的东西灵活运用,用尽量少的指标,用自己的理解去组合,这难道不是创新吗?我们做了这么多年建模,难道你还没明白建模之意义?
    回复

    使用道具 举报

    magic2728 实名认证    中国数模人才认证   

    61

    主题

    478

    听众

    4861

    积分

    升级  95.37%

  • TA的每日心情
    慵懒
    2014-9-29 19:37
  • 签到天数: 409 天

    [LV.9]以坛为家II

    群组数学中国 2015美赛护航

    群组数模专题强化培训

    群组建模思维养成培训

    群组2015美赛护航(强化)

    群组2013年数学建模国赛备

    whwraul7 发表于 2014-2-24 20:55
    我个人对此的看法:
    大部分你说出来了,但是重要的你漏了一些。
    1.网络性质结合实际的运用是你说的要强调 ...

    感谢大家的热情讨论,在此回复如下:
    1. 网络性质与实际的对应我举了几个简单的例子,没有全列出来,至于网络之外的不能作为主体,题目也没有提到;
    2. 网络优势是在模型搭建完成以后,根据建模过程的一些细节写作的,在文章优缺点部分提到,肯定要写,我就没有特意强调了;
    3. 这个联系是一种建模方法,你提的很好;
    4. 这点联想也很棒!谢谢分享!
    祝建模愉快!
    回复

    使用道具 举报

    小左。        

    14

    主题

    40

    听众

    857

    积分

    升级  64.25%

  • TA的每日心情
    奋斗
    2015-5-4 14:45
  • 签到天数: 184 天

    [LV.7]常住居民III

    社区QQ达人

    群组数学中国2013版主团队

    群组学术交流A

    whwraul7 发表于 2014-2-25 13:12
    既然没有做,那我做了的补充一点有何不可,非要把自己的观点放在肚子里?没有创意?我猜你根本就没有研究 ...

    首先我没有刻意,用花花肠子做一些东西,模型建立的意义我通常写在最前面,而优点也是最前面。复杂网络我还是了解一些的,至少我曾和上交的一个研究生一起起草了他的毕业论文,大概是微博用户影响力的东西,你百度下就可以查到。用的基本思想是统计的,学的不多看过一些复杂网络的东西。但是我认为用一些已经用烂的东西做,毫无疑义,譬如说你们的第五个问题,用合作博弈论切入,就是一个亮点。建模没有自己的东西我的一贯观点是不如不做。我们全国组委会的陈中文老师就评价过我:你做的论文,从来让我想看到底,这样的论文一年不会有几次。
    回复

    使用道具 举报

    erchlisa        

    2

    主题

    9

    听众

    360

    积分

    升级  20%

  • TA的每日心情
    开心
    2015-2-11 10:17
  • 签到天数: 110 天

    [LV.6]常住居民II

    自我介绍
    大三统计学生
    magic2728 发表于 2014-2-25 13:49
    感谢大家的热情讨论,在此回复如下:
    1. 网络性质与实际的对应我举了几个简单的例子,没有全列出来,至于 ...

    我们也是做的C题,和这位同学的想法很有几点相似之处。首先是都想到了把2012年题里面的一些东西用起来,另外一个就是把评价文章和评价作者的重要性联系起来。用了一个很基本的二分网络,也是临时扒的不多的几篇看得懂的论文。老师讲的许多东西,像电路的那一块,我们基本没有接触过,比赛时就没敢多看那方面的文章。做ICM题一点很重要的经验就是不一定要多牛,但是一定要多看自己看得懂的,尽量都运用上。
    回复

    使用道具 举报

    whwraul7        

    2

    主题

    9

    听众

    207

    积分

    升级  53.5%

  • TA的每日心情
    开心
    2014-4-21 19:32
  • 签到天数: 61 天

    [LV.6]常住居民II

    小左。 发表于 2014-2-25 21:37
    首先我没有刻意,用花花肠子做一些东西,模型建立的意义我通常写在最前面,而优点也是最前面。复杂网络我 ...

    呵呵,看来你对自己评价还很高。能拿到M说明你比普通人稍强一点,但是我觉得你的思路也没有什么让人眼前一亮的地方,可能没看到论文。而我的论文你也没看到,就下了评论,我一堆点还没出来就被你觉得用烂了,真是逗。你数学可能很强,但这和建模水平联系并不密切。数学用来解决实际问题,当然是越简单得反映本质越好。被用烂的东西,说明他经典,之所以还在用,是因为他有无穷的潜力。被人用的多,一定程度说明其开发能力大。就举pagerank,这种东西十年来用的次数超过几百万次了吧,至今还有很多很新颖的改进方法,这并不能说没有自己的东西,那我可不可以说你的统计之类的东西被用烂呢?为什么你三年M始终无法突破,我觉得你应该有机会得到O的,就是因为你太注重全新的东西,没有把一些基本的东西吃透。像微分方程这种东西,用起来很简单,但遇到实际情况就有无穷的潜力,你却觉得用烂而不用,看起来全是自己的东西,其实经不起仔细推敲,甚至不实用。你要是只为了比赛当我没说。建模,不仅仅体现在比赛里,今后的科研,一样要用到。一切科研扎根于基础,没有基础的创新,不去挖掘基础的东西,水平永远无法提高

    点评

    magic2728  同学,就建模问题本身的讨论我们非常欢迎,你俩都应该在在自己的领域有不错的建树,讨论注意措辞,数学中国欢迎你们!  详情 回复 发表于 2014-2-26 10:02
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2024-4-25 23:23 , Processed in 0.596036 second(s), 107 queries .

    回顶部