万分QFT2013建模美赛B题思路 水资源是极为重要生活资料,同时与政治经济文化的发展密切相关,北京市是世界上水资源严重缺乏的大都市之一。本文以北京为例,针对影响水资源短缺的因素,通过查找权威数据建立数学模型揭示相关因素与水资源短缺的关系,评价水资源短缺风险并运用模型对水资源短缺问题进行有效调控。 首先,分析水资源量的组成得出影响因素。主要从水资源总量(供水量)和总用水量(需水量)两方面进行讨论。影响水资源总量的因素从地表水量,地下水量和污水处理量入手。影响总用水量的因素从农业用水,工业用水,第三产业及生活用水量入手进行具体分析。 其次,利用查得得北京市2001-2008年水量数据,采用多元线性回归,建立水资源总量与地表水量,地下水量和污水处理量的线性回归方程 y?=-4.732+2.138x1+0.498x2+0.274x3 根据各个因数前的系数的大小,得到风险因子的显著性为rx1>rx2>rx3(x1, x2,x3分别为地表水、地下水、污水处理量)。 再次,利用灰色关联确定农业用水、工业用水、第三产业及生活用水量与总用水量的关联程度ra=0.369852,rb=0.369167,rc=0.260981。从而确定其风险显著性为ra>rb>rc。 再再次,由数据利用曲线拟合得到农业、工业及第三产业及生活用水量与年份之间的函数关系,a=0.0019(t-1994)3-0.0383(t-1994)2-0.4332(t-1994)+20.2598; b=0.014(t-1994)2-0.8261t+14.1337; c=0.0383(t-1994)2-0.097(t-1994)+11.2116; D=a+b+c;预测出2009-2012年用水总量。 最后,通过定义缺水程度S=(D-y)/D=1-y/D,计算出1994-2008的缺水程度,绘制出柱状图,划分风险等级。我们取多年数据进行比较,推测未来四年地表水量和地下水量维持在前八年的平均水平,污水处理量为近三年的平均水平,得出2009-2012年的预测值,并利用回归方程 y?=-4.732+2.138x1+0.4982x2+0.274x3 计算出对应的水资源总量。通过预测的总用水量,水资源总量和缺水程度公式 S=(D-y)/D=1-y/D 计算出2009-2012年的缺水程度,根据划分的风险 我们根据建立的模型,确定出农业用水量和地表水是最主要的风险因子,参考无法量化的风险因子如人口规模、产业结构、管理制度、水利工程设施等因素的影响,根据所述的模型,把计算数据进行适当修正,提出一些合理化的建议,从而把风险降到最低,并报告北京市水行政主管部门。 关键词:多元线性回归 灰色关联分析 曲线拟合 缺水程度 风险因子 一、问题重述 水资源,是指可供人类直接利用,能够不断更新的天然水体。主要包括陆地上的地表水和地下水。 风险,是指某一特定危险情况发生的可能性和后果的组合。 水资源短缺风险,泛指在特定的时空环境条件下,由于来水和用水两方面存在不确定性,使区域水资源系统发生供水短缺的可能性以及由此产生的损失。 近年来,我国、特别是北方地区水资源短缺问题日趋严重,水资源成为焦点话题。 以北京市为例,北京是世界上水资源严重缺乏的大都市之一,其人均水资源占有量不足300m3,为全国人均的1/8,世界人均的1/30,属重度缺水地区,附表中所列的数据给出了1979年至2000年北京市水资源短缺的状况。北京市水资源短缺已经成为影响和制约首都社会和经济发展的主要因素。政府采取了一系列措施, 如南水北调工程建设, 建立污水处理厂,产业结构调整等。但是,气候变化和经济社会不断发展,水资源短缺风险始终存在。如何对水资源风险的主要因子进行识别,对风险造成的危害等级进行划分,对不同风险因子采取相应的有效措施规避风险或减少其造成的危害,这对社会经济的稳定、可持续发展战略的实施具有重要的意义。 《北京2009统计年鉴》及市政统计资料提供了北京市水资源的有关信息。利用这些资料和你自己可获得的其他资料,讨论以下问题: 1评价判定北京市水资源短缺风险的主要风险因子是什么? 影响水资源的因素很多,例如:气候条件、水利工程设施、工业污染、农业用水、管理制度,人口规模等。 2建立一个数学模型对北京市水资源短缺风险进行综合评价,作出风险等级划分并陈述理由。对主要风险因子,如何进行调控,使得风险降低? 3 对北京市未来两年水资源的短缺风险进行预测,并提出应对措施。 4 以北京市水行政主管部门为报告对象,写一份建议报告。 二、问题分析 水资源对于经济文化发展和人民的生活水平密切相关,由于在特定的时空条件下,水资源由来水和用水两方面问题组成。来水可描述为水资源总量,具体由地表水资源总量,地下水资源总量,污水处理量三方面构成。用水量描述为总用水量,具体由农业用水,工业用水,第三产业及生活等其他用水三方面构成。从这两个方面入手,可以把握水资源的来源和去向,运用数学建模的方法进行分析,找出主要的风险因子。 第一步:对于水资源总量,主要有地表水,地下水和污水处理量等因素构成,这些量是能够进行量化的,可以根据权威数据,利用多元线性回归的方法对上述因素进行探讨,建立其与水资源总量的回归方程,从而反映出各因素与水资源总量之间的关系。经统计检验认为回归结果显著后,可用于预测和控制。 第二步:对于农业用水,工业用水,第三产业及生活等其他用水因素,虽然此因素能够量化,但考虑到其具有变化性和不可预知性,考虑依据往年的数据进行曲线的拟合,求出其拟合函数。最终运用灰色关联分析的方法确定其中的主要风险因子的具体影响程度。 第三步:将总用水量和供水量进行合成,得出差值。根据定义的缺水程度进行计算,得出北京市各年份的缺水程度表。 第四步:对北京市水资源风险进行综合评估,并做出等级划分。对主要的风险因子进行调控,使风险等级降低,并预测北京市未来两年水资源的短缺风险。 第五步:对于未从根本上影响总用水量和水资源总量的量进行定性讨论,并结合实际给出可行性措施,缓解缺水程度。 第六步:参照实际提出合理化建议。 三、模型假设 1. 假设气象条件对供水量的影响如降雨量最终全部进入地表水资源; 2. 假设地下水资源总量不会因为渗漏减少,且在运输的过程中不损失; 3. 假设再生水全部进入地下水资源总量; 4. 假设各个因素对水资源总量或用水总量作用的大小与其对风险度的作用大小具有一致性。 5. 风险度的大小可以用缺水的严重程度来度量。 6. 假设模型中所引用数据是真实有效的; 7. 假设客观因素不会一起突变 四、 符号说明 1 y为水资源总量 2. x1,x2,x3分别为地表水,地下水,污水处理量 3. y?α为回归方程所给出的值成为回归值 4. a,b,c分别为表示农业用水、工业用水、第三产业及生活等其他用水量 5. D为总用水量 6. S为定义的缺水程度 7. r为影响程度大小 8. t为年份 9. xi(k)为参考序列 10. yi(k)为各标准化序列 11. ρ为分辨系数 12. f为自由度 五、模型的建立与求解 5.1 地表水资源总量、地下水资源总量和污水处理量对水资源总量的影响 5.1.1 多元线性回归分析 由于地表水资源总量、地下水资源总量和污水处理量与供水量关系的不确定,采用多元线性回归分析的方法,确定这三个因素与供水量之间的函数关系式。选取2001-2008年供水量与其部分影响因素数据如表1. 表1 2001-2008年供水量与其部分影响因素数据 设供水量为y,影响水资源总量的因素为地表水资源总量、地下水资源总量和污水处理量分别记为x1, x2,x3。 则建立3元线性回归模型y=β0+β1x1+β2x2+β3x3+ε,其中ε是随机误差服从正态分布N(0,δ),β0,β1,β2,β3为回归系数。 利用2001-2008年表一的实测数据代入上式,于是有 y=β0+β1x1α+β2x2α+β3x3α+ε(α=1,2……,8) 设b0,b1,b2,b3分别为参数β0,β1,β2,β3的估算值,则得回归方程 y?=b0+b1x1+b2x2+b3x3 y?α= b0+b1x1α+b2x2α+b3x3α (α=1,2……,8) 式中yα(α=1,2……,8)为样本值;y?α为回归方程所给出的值成为回归值,称yα-y?α(α=1,2……,8)为残差,它可划为样本值和回归值的偏差。 根据最小二乘法使残差平方和达到最小,即 Q=Σα=1(yα-y?α)2 为最小,根据微积分的极限原理b0,b1,b2,b3必须满足 file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image002.png i=0(i=0,1,2,3) 将此正规方程组化简为(XTX)B?=XTY 其中 file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image004.png file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image006.png file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image008.png 解得估算值 file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image010.png=(XTX)-1(XTY)= file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image012.png 这样计算得到file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image010.pngi代入回归方程的回归方程如下 y?=-4.732+2.138x1+0.498x2+0.274x3 把(x1α,x2α,x3α)代入上式解出各个回归值(y?1,y?2…,y?8) 计算 file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image014.png →file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image016.png 自由度为fu=p=3 计算 file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image018.png=30 自由度为fα=n-p-1=8-3-1=4 总的离差平方和Syy=U+Q 检验回归方程的显著性等同于检验假设 H0 :β1=0,β2=0,β3=0. 作统计计量 F =file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image020.png=file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image022.png=file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image024.png=8.04 用α=0.05查表临界值F0.05(3,4)=6.59易见8.04>6.59,因此拒绝H0 即回归方程效果显著 5.1.2水资源总量与其部分影响因素的定性分析 根据所得的回归方程y?=-4.732+2.138x1+0.498x2+0.274x3,x1,x2,x3前的系数关系为 rx1>rx2>rx3即(2.138>0.498>0.274)。当x2,x3固定时,x1增加一个单位,y?将增加2.138个单位。同理x2变量时,y?增加0.498个单位,x3为变量时,y?增加0.274个单位,可见地表水量是最主要的影响因素,其次是地下水量,污水处理量相对来说影响较弱。由于各个因素对水资源总量作用的大小与其对风险度的作用大小具有一致性,所以地表水量对风险的影响最为显著。 5.2对于总用水量与其部分影响因素的分析 5.2.1影响总用水量的包括农业用水,工业用水,第三产业及生活等用水三方面。由图表数据对三方面因素进行拟合,如图2,同时确定其函数关系 由图表可以看出在1994年以前由于政策、耕作方式、产业结构的问题数据波动较大,而在1994年以后可近似看成连续曲线,所以我们选取1994年以后数 据进行拟合分析,得出关系表达式。 file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image026.png 图2 总用水量、农业用水量、工业用水量以及第三产业及生活 等其他用水拟合关系表 由图2 考虑时间的连续变化,通过拟合得出农业用水量曲线,如图3所示 file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image028.jpg 可以得出函数关系为 a=0.0019(t-1994)3-0.0383(t-1994)2-0.4332(t-1994)+20.2598 同理,对工业用水进行拟合,如图4 file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image030.jpg 图4 工业用水拟合图像 可以得出函数关系为 b=0.014(t-1994)2-0.8261t+14.1337 同理,得出第三产业用水。 file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image032.jpg 第三产业用水拟合图像 可以得出函数关系为 c=0.0383(t-1994)2-0.097(t-1994)+11.2116 总用水量由此三方面组成 由农业用水、工业用水、第三产业及生活量等三方面的函数关系得总用水量 即: D=a+b+c 5.2.2灰色关联分析确定农业用水,工业用水,第三产业及生活用水对总用水量的影响大小 由于农业用水,工业用水,第三产业及生活用水与总用水量关系的不确定性,采用灰色关联分析的方法,确定这三个因素对总用水量的关联程度。 从1980-2008年的总用水量与农业用水,工业用水,第三产业及生活用水数据进行抽样,抽样结果如下表(表5) 年份 | | 农业用水(亿立方米) | | | | 50.54 | | | | | 47.22 | | | | | 40.05 | | | | | 36.55 | | | | 1988 | 42.43 | 21.99 | | | 1990 | 41.12 | 21.74 | | | 1992 | 46.43 | 19.94 | | | 1994 | 45.87 | 20.93 | | | 1996 | 40.01 | 18.95 | | | 1998 | 40.43 | 17.39 | | | 2000 | 40.4 | 16.49 | | | | 34.6 | | | | | 34.6 | | | | | 34.3 | | | | | 35.1 | | | |
表5 总用水量与农业用水,工业用水,第三产业及生活用水数据 第一步:将各年的用水量作为参考序列x0(k),k=1,2,3……15,各影响因素作为比较因素序列xi(k),i=1,2,3,k=1,2,3……15,对各因素初值化处理,得各标准化序列yi(k),i=1,2,3,k=1,2,3……15,得到无量纲序列表6 | | 农业用水(亿立方米) | | | | | | | | | | | | | | | | | | | | | | | 1988 | | | | | 1990 | | | | | 1992 | | | | | 1994 | | | | | | | | | | 1998 | | | | | 2000 | | | | | | | | | | | | | | | | | | | | | | | | |
表6 各因素数据无量纲序列 第二步:根据上表求取差Δ0i(k)=| y0(k)- yi(k)|,得序列。 求出其最大值为Δmax=3.245849,最小值Δmin=0 第三步:由此计算出关联系数如下: 令分辨系数ρ=0.5,根据灰色关联度系数公式 r(x0(k), xi(k))=(Δmin+ρΔmax)/( Δ0i(k)+ρΔmax) 令ξ0i= r(x0(k),xi(k)),则计算出ξ01,ξ02,ξ03 第四步:计算关联度并进行优势因素分析: 取各点权重ω1=ω2=ω3=……=ω15=1/15,根据灰色关联公式 file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image034.png 令r0i=r(x0, xi) 求得比较因素xi和参考因素x0的关联度如下 记 r01=0.369852 r02= 0.369167 r03=0.260981 5.2.3农业用水、工业用水、第三产业及生活用水量与总用水量的关联度的定性分析 依据关联度大小,各因素关联度大小排序:r01>r02> r03,表明在影响总用水量的因素中农业用水是最为关键的因素,其次是工业用水,最后是第三产业及生活用水。各个因素对水资源总量或用水总量作用的大小与其对风险度的作用大小具有一致性,风险度的大小可以用缺水的严重程度来度量。也就是说,农业用水与总用水量正相关,而且是最重要的风险因子。 5.3风险等级的划分 定义 缺水程度由总用水量和水资源总量共同作用决定,我们用缺水量(总用水量D-水资源总量y)与总用水量D的比值来表示。 即 S=(D-y)/D=1-y/D 通过此公式计算2008以前实际缺水程度如下表 年份 | | | | | | | | | | | | | file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image035.png | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |
由于缺水程度在一定程度上可以反映水资源短缺风险大小,因此我们可以通过缺水程度来划分水资源短缺风险等级如下表。 5.4预测未来水资源短缺风险与综合评价 通过我们的计算,进行合理的假设和猜想,定义缺水程度来衡量风险等级。经过建立的模型可以较为准确的预测未来的水资源风险等级。 5.4.1预测总用水量 农业用水量 a=0.0019(t-1994)3-0.0383(t-1994)2-0.4332(t-1994)+20.2598 工业用水量 b=0.014(t-1994)2-0.8261t+14.1337 第三产业及生活等其他用水 c=0.0383(t-1994)2-0.097(t-1994)+11.2116 由于总用水量D=a+b+c 可预测出未来四年内每年的总用水量 年份 | | | | | 2009年 | | | | | 2010年 | | | | | 2011年 | | | | | 2012年 | | | | |
5.4.2预测水资源总量 根据我们对2001-2008年的数据研究分析,地表水和地下水在一定范围内波动,污水处理量基本处于上升趋势,鉴于此,我们大胆预测未来四年内水资源的基本情况。根据统计原理发现,地表水量和地下水量基本在一定范围内波动,而污水处理量因为国家政策的支持所以一直处于持续升高的状态,我们取多年数据进行比较分析,推测未来四年地表水量和地下水量维持在前八年的平均水平,污水处理量为近三年的平均水平,因此未来四年水资源量的推测如下: 说明:水资源总量可由线性回归方程求解 y?=-4.732+2.138x1+0.498x2+0.274x3 5.4.3预测未来的风险等级 通过对总用水量和水资源总量的预测,可以得到清晰的等式关系: S=(D-y)/D=1-y/D 带入运算数据进行练习,得出预测结果 2009年 缺水程度:0.32395 风险等级:中等风险 2010年 缺水程度:0.32804 风险等级:中等风险 2011年 缺水程度:0.33732 风险等级:中等风险 2010年 缺水程度:0.34783 风险等级:中等风险 5.5 结果的分析与检验 对于其中的2009、2010年数据预测后查阅资料发现,预测数值与真实数值相差不超过10%,再次运用估算结果进行预测,误差应该在标准范围内真实可信。同时也证明前述方法可行。 5.6模型的改进 对于另外一些风险因子,并未从根本上影响到总用水量和水资源总量,我们没有定量进行计算,但从北京市政府的实际工作中可以看出,一些措施还是卓有成效的,其中核心对策有5项: (1) 实施应急供水工程。从2003年开始,北京市分别启动了怀柔、平谷、张坊和南水北调等应急供水工程,部分增加了水资源可供应量。南水北调中线工程将于2013年竣工,预计每年为北京调水10亿立方米,将会大大缓解首都用水短缺问题。 (2) 推进再生水回用。截止2006年底,北京城区共建设完成高碑店等9座污水处理厂,铺设排水管线4000km,日处理污水能力达250万m3,污水处理率达90%,提前实现了奥运会环境治理目标;建设完成4座再生水厂、铺设再生水管线350km,日供水能力达96万m3,再生水回用率达46%,城区水环境得到了明显的改善。再生水可用于市政用水、生态环境用水(河湖补水、冲洗马路及灌溉绿地等)、回补地下水、工业循环用水和农业灌溉,是一项很大的潜在水源。 (3) 调整产业结构。北京市产业结构调整的方向只要是加快发展现代服务业,大力发展高技术产业,适度发展现代制造业,转变农业增长方式,促进农业规模化、现代化、市场化经营,发展都市型现代农业;逐步退出现有的高能耗、高物耗、低附加值以及破坏人文生态环境的行业,严格控制并逐步淘汰资源开采型产业,限制并淘汰落后的工艺与装备。通过产业结构的调整,北京市三产结构由1980年的29.9:48.2:21.9调整到2006年的11.7:48.9:39.4,总用水量有1980年的48亿m3降低到2006年的34亿m3,一二三产的用水比例由1980年的63:27:10调整到2006年的37:18:45.因此可以看出,通过产业结构调整来促进用水的效果非常明显。 (4) 发展农业节水灌溉。目前,北京市农业用水占北京市总用水量的35%-40%,农业仍然是用水大户。在资源严重短缺的情况下,农业还存在用水效率低下、用水浪费严重的现象。在北京市郊区发展多种形式的农业综合节水,可以大大提高农业用水效率,减少农业用水量。 (5) 提高水价。根据北京市1990-2000年的有关数据分析,水价每提高1%,在其他情况不变的情况下,生活用水量将下降0.366%。一般认为,城市家庭可承受的水费支出占家庭可支配收入的比率可达3%-5%。目前,北京市的年人均水费支出仅占可支配收入的1%左右,因此还存在一定的上调空间,可通过价格机制促进节水。 六、模型评价与推广 6.1优点 1.模型所展现的信息量比较大,对实际问题进行了比较全面的分析。 2.本文运用了多元线性回归的方法,模型经过数据的整合,计算,最终通过验证数据的验证得出准确的表达式,具有良好的时序性、可信性和说服力,客观准确的说明了问题。 3.通过分类讨论从来源与去路两方面运用不同的方法、不同角度、不同因素讨论问题,使得问题得到很好的解决。 4.通过已知数据的检验,具有更高的精度,预测更加准确。 5.运算简便,模型简单。 6.2缺点 在研究缺水风险问题中自定义了较少的量进行综合评估,在一定程度上不能完全评估风险等级,还需更多的量进行验算。模型对于得到的所有数据并没有完全使用,而是抽取了其中部分数据,可能会对最终结果带来偏差。 6.3推广 在本文对于影响风险因子的因素进行了分类分析,根据实际情况调控相关因素。对于不同类型,不同关系的数量运用了不同的方法,保证了问题的相关性及可信度。通过此模型,可以简单有效的对水资源风险等级进行预测,划分等级,起到了提前预防,减少损失的作用,给出较为准确的公式,对对水资源风险预测具有一定的指导意义,水资源问题可用此模型描述。 七、有关建议 根据前文所述的模型,通过计算得出较为准确的数据,提出一些合理化的建议,对现实工作进行指导 1. 在分析多元线性回归问题中,得出y?=-4.732+2.138x1+0.498x2+0.274x3,可以看出地表水对水资源总量的影响远高于其它两个因素,地表水容易利用但是水量不稳定,建议多修建堤坝等水利工程,对地表水进行合理的控制。 2. 通过对总用水量曲线的拟合发现,农业用水对总用水量的影响高于其它两方面。建议改善农业耕作方式,提高农业用水率。 3. 在总用水量的重要组成因素第三产业及生活用水量的曲线中发现,此因素持续增长,同时对比人口曲线发现,第三产业及生活用水量与人口正相关,人口是其增长的最主要因素,所以建议有关部门有效地控制人口规模。减小北京市的人口压力。人口规模、降雨量、产业结构、管理制度、水利工程设施 4. 农业用水和工业用水是总用水量的重要组成部分,调整产业结构,减少或转移高耗水农产品的种植,采用滴灌型农业,转移高耗能高耗水企业,转向低能耗高技术产业。 5. 适度提高水价,提高人民的节水意识。 ' k0 u8 D/ K4 m; O- w4 e
|