查看: 5054|回复: 8

[建模教程] 高考生源预测

[复制链接]

字体大小: 正常放大

775128646

1 主题	3 听众	69 积分

升级 67.37%

TA的每日心情

	开心 2011-12-16 12:00

签到天数: 10 天

[LV.3]偶尔看看II

群组: 中国矿业大学数模培训

电梯直达

1^#

发表于 2011-8-26 21:39 |只看该作者 |倒序浏览

|招呼Ta 关注Ta

预测2013年山东省高考生源状况
摘要
该问题给出三张表格，分别是历年普通高等教育、普通中学、小学的学校数，招生数，毕业生数，在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。
我们把高考生源状况用高考的毕业生人数指标来估计，故该问题转化成预测2013年的高考毕业生人数。在表2中，我们看到在校人数与招生人数约成3倍比例，故将表2当作高中的数据。
结合实际，我们知道高考生源与高考毕业生数联系密切，但同时受到高校招生人数的影响。据此，我们给出三个模型：模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数，在拟合过程中我们剔除了一些差异较大的数据，经整合，结果为103.0261百万；模型Ⅱ是先根据表2中的时间与招生人数的关系，预测2010年的招生人数，再找到招生人数与3年后的毕业人数的关系，据此可估计2013的毕业人数，得到90.5934百万；模型Ⅲ则是对模型Ⅱ的改进，将当年的高校招生人数考虑进去，我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重，同时可以根据表1时间与招生人数的关系预测2013的招生人数，从而可得到2013的毕业人数，约为109.653百万。
上述三个模型的结果差异在10%左右，由于实际中，高考生源情况受很多因素影响，因此以不同的数据指标来估计，存在误差是可能的，并且对于所用数据也是受很多因素影响的，这些数据本身存在误差，但是我们在现有数据下，不能消除误差。但是模型的建立还是合理的。

关键词：直接预测法  间接预测模型改进三种模型误差分析

问题重述
该问题给出了三张表，分别是1981—2009年普通高等教育、普通中学、小学的学校数，招生数，毕业生数，在校学生数。根据所提供数据，运用三种方法预测2013年高考生源状况。
问题分析
要求预测2013年高考生源状况，而在所给数据中，给出的指标为学校数，招生数，毕业生数，在校学生数，其中高中的毕业生数应该相对更接近生源的实际情况，而普通高校的招生人数也与当年的生源有关系。从不同的角度出发，我们可以用不同的方法来预测2013的高考生源状况。
对于所给数据，我们注意到在表二中，在校学校人数约为每年招生人数的三倍，据此估计该表为高中生源情况表。
模型的假设
表二所给数据为普通高中的数据。
高中生源情况以高中毕业生人数来估计。
定义及符号说明
：模型Ⅰ的时间变量；
：模型Ⅱ的对于高校招生人数的时间变量；
：模型Ⅱ的对于中学招生人数的时间变量；
：某一年高校招生人数；
：某一年中学招生人数；
：某一年的中学毕业人数。
模型的建立及求解
5.1 模型Ⅰ的建立及求解
由于高考的生源状况与当年的高中毕业生人数息息相关，因此我们可以利用表2来拟合函数，直接预测2013年高考生源情况。
5.1.1 模型Ⅰ的建立
提取表2中年份及毕业数两组数据，用Matlab进行拟合，作图得：
（图1）
   由图像，以1994年为间隔点，之前的图像与之后的图像有很大不同，结合之前的国家政策等方面，如果预测2013年的情况，用1994年之后的数据拟合准确率较高。
因此我们根据1994-2009的数据作图有：
（图2）
对该数据进行二次多项式拟合：
（图3）
5.1.2 模型Ⅰ的求解
拟合所得函数为：
；
带入，得到：。
5.2 模型Ⅱ的建立及求解
由于高考的生源状况与3年前的高中招生人数相关，因此我们可以利用表2给的招生人数来拟合函数，预测2013年高考生源情况。
5.2.1 模型Ⅱ的建立
提取表2中年份及招生数两组数据，用Matlab进行拟合，作图得：
某年份的中学招生人数如下图所示：
（图4）
建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到：
（图5）
模型Ⅱ的求解
对于2010年中学招生人数的估计，我们Matlab拟合一个二次多项式函数为：，将带入，得到，即3年前的中学招生人数估计。
对于2013年的中学毕业人数与3年前的招生人数的关系式，我们用Matlab拟合一个一次线性关系式函数为：；
将带入上式，得到：。
5.3 模型Ⅲ的建立及求解
  由于某一年生源不仅与3年前的中学招生数有关，与当年高校招生人数也有一定关系，故可以把生源看成是两者作用的结果，利用多元线性回归分析得到一个拟合函数，进而估计数据。
5.3.1 模型Ⅲ的建立
  首先对给出各年份的高校招生人数趋势：
（图6）
某年份的中学招生人数如下图所示：
（图4）
如模型Ⅰ所述，我们要忽略之前的一些数据，在此模型中，我们不妨取1999—2009年的数据，利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。
通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程，带入前面所估计数值，就得到2013年的预测生源情况。
5.3.2 模型Ⅲ的求解
对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式：，
将带入得，，即为2013年高校招生人数估计。
对于2010年中学招生人数的估计，我们们Matlab拟合一个二次多项式函数为：，
将带入，得到，即3年前的中学招生人数估计。
利用数据，给出高校招生及3年前中学招生人数对当年生源状况的回归分析，，
将，带入得。
模型的评价与比较
第一种模型中，利用中学毕业人数直接估计生源数，考虑因素唯一，毕业人数和生源之间存在误差，加上数据本身的误差，其结果与实际结果存在误差，但误差不能完全消除。
第二种模型中，先估计中学招生人数，进而找到招生人数与毕业人数的关系，由此来估计中学的毕业人数，这种方法有一定参考价值，并不直接预测，结果与第一种模型差很多，因为该过程中多次运用有误差的数据，因此结果会有差异。
第三种模型则是第二种模型的优化，考虑到了高校的招生人数，增加了影响因素，根据所给数据预测二者对生源的影响权重，使数据的运用更加合理。
在上述模型中，均对一些数据进行了处理，如剔除了一些数据，因为受**因素及其他因素的影响，前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确，我们可以利用近10年左右的数据。
但是由于我们把生源情况当作高中毕业人数来估计，这其中是存在误差的，加之处理数据时也存在误差，故我们的模型仅能给出一种预测方法，如果是数据更加合理，我们还应考虑其他一些因素，进一步优化模型。
参考文献
姜启源，数学建模，机械工业出版社，2005年
吴建国，数学建模案例精编，中国水利水电出版社，2005年
附录
8.1 模型Ⅰ程序
x=1994:2009;
y=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];
A=polyfit(x,y,2);
z=polyval(A,x);
plot(x,y,'k+',x,z,'r') ;
A*[2013^2 2013 1]'
ans =103.0261

8.2 模型Ⅱ程序
t1=1991:2006;
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
plot(t1,x1,'*')
a=polyfit(t1,x1,2)

x1=[85.31 2.4862 125.17;
96.87 3.2745 119.41;
105.22 3.0211 112.21;
116.95 3.2972 115.88;
120.41 3.5714 123.8;
118.61 3.4308 125.02;
115.14 3.5023 125.52;
115.3 3.6067 125.17;
115.58 5.7878 123.3;
115.88  5.7918  125.6;
116.82 5.5036 129.17;
118.14 5.5611 132.87;
122.97 5.6544 139.14;
141.95 5.6950 154.67;
159.91 6.2994 167.06;
164.88 8.2410 169.69;
167.96 12.4817 178.19;
188.59 18.3553 201.28;
205.62 21.8719 222.2;
222.82 27.3894 234.18;
213.8 32.7452 220.94;
207.29 40.0573 201.65;
196.7 44.5034 192.94;
191.02 45.3479 192.32;
172.88 51.4176 179.71;
158.65 50.1082 164.6;
];
x=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);
[b,bint,r,rint,stats]=regress(y,x,0.05)

8.3 模型Ⅲ程序
t1=1999:2009;
x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];
plot(t1,x1,'*')
a=polyfit(t1,x1,1)

t1=1991:2006;
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
plot(t1,x1,'*')
a=polyfit(t1,x1,2)

zan