6 r" o& U: \: l" l
这里借用论坛大神“我一直都在”A题分析做模板,感谢大神的贡献。 模型准备:至关重要的数据挖掘 确实就本题而言,模型数据的获取和挖掘无疑是至关重要的,如何从两个视频中获取数据,能够获取哪些数据,数据的准确度如何度量都可以是贯穿全文的亮点。个人认为这也反映出数学建模比赛的一个趋势—从给你数据到让你挖掘数据——事实上这也是时下炒的很火的大数据时代对人的要求之一。(扯得有点远) 关于数据挖掘对本题的重要性,我们会在正文的分析中逐问像大家道来。 我们不但挖掘视频,还挖掘附件,不但挖掘附件,还挖掘题目。。。 第一问:根据视频1(附件1),描述视频中交通事故发生至撤离期间,事故所处横断面实际通行能力的变化过程。 有人说,做完今年的数模A题,终于知道这辈子回味过最多次的视频是什么了。 这道题常规的思路都大同小异,大致是定义一个时间间隔统计,统计每个时间间隔上游车流量和下游通行量,道路拥挤情况(是否堵车)… 关键点是实际通行能力的变化过程的定义,实际上这可以说是本题坑爹的开始,如果按照百度百科之流的专门定义,通行能力就是道路允许的最大车流量。很多人在这里就觉得一定是题目有问题,这不一常数嘛!!!(是不是有同感啊),转而理解为是分析车流量的变化情况,(目前看到的大多数分析也都是如此,本文仅代表个人意见,欢迎拍砖,拒绝谩骂,口水仗~)可是为什么我们部多想一想,会不会是有什么信息是自己没有发现的呢? 道路通行能力真的是常数吗? 查阅资料:“影响道路通行能力的主要因素有道路状况、车辆性能、交通条件、交通管理、环境、驾驶技术和气候等条件。”结合视频1我们逐条分析,直觉上驾驶技术和其车辆性能,道路状况,环境,气候要么显然是常数,要么完全无法分析,这里直接跳过,那其他几点呢? 交通条件,可以理解为道路的车流量吧,很好理解,一条路上车越多,车平均速度越慢,通行能力相对较低(greenshield公式),如果堵车,通行能力直接秒0。从视频中可以看出,道路除在最后10min里持续堵车外,基本上是由于信号灯切换导致的间歇性小堵车,是不是可以理解为交通条件一直在发生变化?对视频2车流量统计数据进行回归分析,发现回归方程斜率为负,这是不是暗含着由于堵车程度加剧,道路通行能力下降的趋势? 交通管理,这个自己做的时候也没看出来,后面看一些大神做视频分析的时候提到了——交警叔叔,无序的道路和有序的道路相比,虽然是同样的交通硬件,软件——通行能力会依然会有差距。(因为自己也没看出来,所有没有数据验证这个影响,可结合视频前后的车流量进行验证)。 其他因素不一而足,这里只想到这几个。 对问题的理解 不知道是不是我们组习惯不好,每次做题都喜欢把数模问题搞成文字游戏,对同样问题的理解,那真是十人九不同,但由几点要注意:有交通事故发生至撤离期 就不要在事故前和后面那几分钟说太多的废话,废话连篇只能证明自己题都没看懂;实际通行能力的变化过程 ,实际通行能力的定义争端不说了,题目要我们分析变化过程,但是题目中说是只要我们分析车祸带来的变化吗?交警叔叔的变化算不算?突然蹦出一大堆2轮车把路给堵死了算不算,不记得哪个视频了,上游本来走的好好的,突然来了辆面包车违章停车,瞬间路就走不通了,这个带来的变化又要不要分析? 不记得是哪位大神说的了,对题意的理解和贯彻决定做题的高度和方向,对材料的挖掘和分析决定做题的深度和广度。很多组将第一问的通行能力理解为车流量(好分析多了),又认为第三问的通行能力表示道路允许的最大车流量,总觉得这种理解有点嘲笑出题人智商啊。。。这也是一种思路吧,只是个人才疏学浅,也不清楚这些年全国赛的题目是不是一直就在玩这种把戏; 描述 注意下动词,第一问是描述 第二问是分析说明注意到这点,12问的详略关系就不言而喻了。 第二问:根据问题1所得结论,结合视频2(附件2),分析说明同一横断面交通事故所占车道不同对该横断面实际通行能力影响的差异。 第二问是一个非典型的因素分析问题:为什么说它是个非典型的分析问题,因为它来源于实际情形,很多因素拍拍脑门结果就出来了,和从视频里截下来的数据一比照,好像都对,就觉得这是真理。。。这真是真理吗? 数据挖掘——参数,分布是好东西,随便改改就可以解释世界 参数,比例系数这种神兽级的建模道具想必大家都不会陌生吧,一句“你懂得“,实在是可以道尽天下数模人。。。。(不要在意。。。。这不是讽刺社会) 这实际上即便排除个人创造对参数失真造成的影响,选取错误的标准,随机性导致不符合分布,假设存在错误等非主观因素同样会导致对结论错误的分析,得出似乎正确的结论(这种结论可以忽悠数模,但是在实际科研中,往往就是致命伤)_对于这种情况,最好就是将引用的参数和实际数据互相补充,相互映衬。 里只对几个有代表性的给一点说明,至于正确与否,大家不妨好好想想: 1.两次车祸时间相近,所以上游车流量可以认为是相等的, 2.当量车换算——大车=1.5*小车 3.拥堵程度=平均车流量 4.下游通行比例(左中右各百分之多少的那个)决定上游车各车道通行比例。 。。。。。。(这个似乎很有道理,也符合实际结果,但到底是不是真理,视频里显示的才是硬道理) 该问一个比较好的做法就是多变量分析+控制变量法,想显得高端的可以建立度量量化模型来分析,必须将几个有代表性因素(上游车流量,各车道通行比例,侧道车流,下游通行能力)逐一分析,之后根据分析的结果,排除无关变量的干扰,收缩变量数目(有点像偏相关分析)得出结论。 说的好像很高端。。。实际在这一道题中似乎视频二比一车流量要大,但是堵车情况却小,再加上左中右分布比例和视频中不同车道过事故地点用时等因素。。。。实际上分析结果很大程度上是和你的指标定义相关的,重点还是合情合理 第三问:构建数学模型,分析视频1(附件1)中交通事故所影响的路段车辆排队长度与事故横断面实际通行能力、事故持续时间、路段上游车流量间的关系。 方法是多样的,高端是必须的,符合才是王道。 不要指望一开始建立的模型就能完美的解决所有问题,层层递进的建模过程能让老师感受到你们的努力。 自己组做的时候使用的是x\m\1排队模型, 本题实际情形同标准排队模型相差还是比较大的,必须对基本模型进行一定的修正。 修正一,上游车流量的分布:排队论要求车辆流服从泊松分布,实际上,由于红绿灯的影响,车流显然是不满足这个要求的。 引用大神关于车流分布的描述: 就通过统计并检验可以发现右转(不受信号灯控制)到来的车辆和直行车辆都是服从泊松分布的,而通过横截面的车辆也是服从指数分布的 但是从排队理论进行分析可以发现,在求解队长的过程中,只需知道平均到达率(就是上游车流的均值)就行了,并不要对数据分布有要求。 修正二:ρ的取值, 有人说:“排队论求的的是等待长度的平均值,不能描述变化过程。”这其实是个误会,排队论求等待长度的平均值有个前提——是服务强度ρ<1,实质就是迭代收敛,二是时间足够长,模型进入收敛。 但是实际情形中ρ到低是多少,真的很难说(如第四问,显然ρ大于一)为了增强模型的适用范围,我们对非稳态情况下排队模型进行分析,建立了暂态排队模型对非稳态下队长和3因素的关系进行了分析。实际上我们只做到这一步,但如果将概率分布引入排队模型,得到一个波动的范围解,模型的说服力会更加(集散波模型就是为克服排队论没有反应这种随机波动的特点二因运而生的) 至于其他几种方法(集散波,多元回归没有做过,也不清楚实际效果。。。就不妄下评价了) 建模完成好开心,但是模型的检验不能少。关于检验这里有个比较有新意的想法:可以将视频1中(一共有6次堵车)每次堵车看做一次独立的车祸事件(无后效性,独立性)提取信息,一半用来调整模型参数,一半用来检验模型效果(视频的数据是最真实的数据,又是数据挖掘啊) \ 第四问:假如视频1(附件1)中的交通事故所处横断面距离上游路口变为140米,路段下游方向需求不变,路段上游车流量为1500pcu/h,事故发生时车辆初始排队长度为零,且事故持续不撤离。请估算,从事故发生开始,经过多长时间,车辆排队长度将到达上游路口。 经历完第三问的大洗礼之后,乍看4问是不是有一种格外心喜的感觉?这里必须明确一点,十分明确。直接带入第三问模型求解,把第四问当成第三问的模型检验是不妥当的! 不知道大家想过没有,为什么我在第三问时对排队模型要进行那么多的修改(没写出来的肯定更多),其实里面很大一部分都是为了增强模型的适用性。实际道路情形绝对是各种复杂的,根本就没有可以笼统概括一切的一个公式,在求解之前必须先针对4问给出题设进行具体的前期分析,判断到底符合哪一类排队问题 注意题目中的几个关键点: (1)交通事故所处横断面距离上游路口变为140米 如果只是解方程,为什么不直接问什么时候到140米?干嘛要说距离上游路口140米,是为了告诉我们路口要堵住了大家快来解决吗?肯定没有这么简单,如果这一点无法说服你,请看(2)。 (2)路段下游方向需求不变 这是一个很明显的暗示!第四问肯定要和分流有关! 那么具体应该怎么做,前文提到,这是衡量国一的标准,可我只有国二的水平,所以我不知道,不过可以提供几个不成熟的想法: 如果有辆车可以右转,也可以直行,当他发现直行堵住而且独得很厉害的时候,他会不会可能选择右转,这样排队长度就会降低,降低了后面的车已经不堵又跟上 了,跟上又堵住,后面又可能右转了!!!这是一个是否绕道的0-1分布,而概率则取决于排队长度,是不是有动态规划和差分方程的思想在里面? (这一段摘抄大神原文未改,确实没有想到,但觉得比较有思想) 大致估计了一下,如果采用最简单的概率及其分布,并结合流量比例的话,结果大概是8.95min。 上游车流量1500pch/h 这是个什么概念,为什么不是1000,不是2000,偏偏给你一个1500?结合视频1下游流量统计(再一次数据挖掘)下行流量最大值不超过1200pch/h这是什么概念?定性分析入>出,直观的说就是队伍一直在堵,越来越长(也才可能堵到140米啊)定量分析 既然路一直是拥堵状态——下行车流量用视频1大堵车(最后15分钟)平均下行车流量来度量就很有说服力了,计算结果约为1050pch/h;各种参数 如同前面说的参数真的很神奇,比如车平均间距,可能你取5米,时间就是400s 取4米就涨到600s,老师不是傻子,你懂,人家就笨?第四问拼的就是一个细致活,如何把参数设置的合理… 举个最浅显的例子,“大车=1.5*小车的合理性” 和 “小车车长 3.8-4.2米 大车车长8-10米“同样是规范车辆类型影响的定义,哪个比较靠谱,不言而喻 基本上就是这些,最后用软件进行下仿真什么的属于锦上添花,求出来的结果可以是区间,也可以是具体的值,但是做好误差分析,我们队用VISSIM仿真平均解为430s左右,模型解为8.4min。应该还是比较靠谱的。 追求卓越,成功便不期而至。数模不仅仅是拿奖的一门艺术,更多的是去享受其中的过程。有一种感动,只有亲身经历了才能体会。祝愿大家能从数模竞赛中拿到好奖,更祝愿大家在数模奋斗的过程中能收获其中的喜悦和疲累。 鉴于本人能力有限,各种疏漏各种搞笑,还请大家海涵,以交流为主,拒绝无礼谩骂。有兴趣的欢迎留言,需要论文原文的也请留言(最终稿还不在我手上。。。) , f7 c8 d. q) h: u
|