预测2013年山东省高考生源状况: E+ o0 T5 U& H- z! g9 K
摘要" T8 `4 ?! ?' z$ C8 m/ H
该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。" @4 Q( Z) u+ D, ^# Q; X6 t( y' {
我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。 a8 P J* T" f, y 结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。 f: N8 f. G' T& s 上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。 1 e- P( N# r+ `% S7 u3 ^ ( C, ?! m: K4 d% L3 j \4 |: Z
2 T& T8 Y9 _/ z: D$ v % e) x7 H9 y: [+ m c& p : Q" @ @6 v, s% y
5 A K* c6 L8 x9 r( [ 5 o+ V2 O& R; N
$ ?. l: q' _4 J) g7 w9 k, ~0 @+ [ 4 J$ B0 v/ A/ C! [/ k ) E' J, `) A5 m2 x f 关键词:直接预测法 间接预测 模型改进 三种模型 误差分析; E' F3 o) H2 g' v
7 g4 s. u9 @7 A' d0 [0 H x# F
]7 o* K. v1 q3 R+ v( e0 K
$ }" a# z1 G$ ~" l+ F2 ~ 5 s( D' H2 R7 F9 Z问题重述 V ~7 G; Y, ^$ x( q; A4 P% q 该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。, w9 P/ F6 O7 U) B/ o
问题分析 8 X& B* Q7 z6 A: [( \ 要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。 " H9 u3 ~" A7 f% o 对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。3 Q) J, ~* L4 x8 w1 s) m
模型的假设# x7 t1 \7 M/ t( }& i( }
表二所给数据为普通高中的数据。5 z0 w U& T- X1 P% k+ T; s6 e0 f
高中生源情况以高中毕业生人数来估计。) @$ j- \6 v1 @+ [2 O2 U& J
定义及符号说明. b' k2 Z: Q: B4 {; j% o
:模型Ⅰ的时间变量;# N3 \8 S$ ^1 B! B- p- w& H5 x$ L
:模型Ⅱ的对于高校招生人数的时间变量;, z9 k- D$ @2 d7 U) N
:模型Ⅱ的对于中学招生人数的时间变量; - M& e4 p0 c3 Y2 B# k:某一年高校招生人数;3 p7 ?6 U4 l* h4 N8 g1 V0 \& ^
:某一年中学招生人数;- ?6 l8 v' k1 d* {+ ]
:某一年的中学毕业人数。 , q, n7 t/ A: K4 A, Y/ a模型的建立及求解 8 u1 d- c: N( F5.1 模型Ⅰ的建立及求解 ( ^0 I3 b( X$ B! @ 由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。 / m" t+ f6 {( ? h; l4 |0 n5.1.1 模型Ⅰ的建立 6 w: Y+ C& \; v- P, b7 S0 Y' G8 r) h 提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得: 5 j& c$ o j8 y( }" A0 h" O, b (图1), v6 l! T. A5 k& Y
由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。 3 d3 N2 G# h6 M* ?4 S, I$ ` 因此我们根据1994-2009的数据作图有: M, u9 w V: n8 V2 d5 _7 p0 W* M; l. h (图2)$ S7 Y6 w. H2 I/ a2 h
对该数据进行二次多项式拟合: % m |. u" J7 e. f" M (图3)$ Z$ i7 G" B7 _& |: c# ~
5.1.2 模型Ⅰ的求解 7 W3 c' T/ n9 p+ j8 F 拟合所得函数为:. ^: |0 k) J/ ~, x
; o* o6 O( `! Q3 G
带入,得到:。 - o4 ^8 _3 r" N' [4 ~$ T) [ }5.2 模型Ⅱ的建立及求解5 z( O. }3 ?" `& U) A
由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。 4 C* Z& O, T0 W a5.2.1 模型Ⅱ的建立 9 X& z6 e9 x% C- T' t0 C. n提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得: & P: i) C6 C5 m: C& v$ d某年份的中学招生人数如下图所示: ; S% q5 r! s$ W. O6 H% ^9 v6 J(图4) + u# v6 m, \6 r9 @2 a( O建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:/ Z, W+ ?: {& k( n# d1 C; r
(图5)$ y6 }7 Y- t; w
模型Ⅱ的求解 2 i$ M4 \( Y9 p3 w$ y对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。! [. t' |: P: K3 u, B4 q
对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:; # p8 w( W. \+ K9 e将带入上式,得到:。/ `: l6 n; R; \: H& D, [
5.3 模型Ⅲ的建立及求解 : N. x# z8 t$ w- D& I 由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。 ! C4 s _- z, _& O; A/ l5.3.1 模型Ⅲ的建立1 [: v0 B9 v8 s
首先对给出各年份的高校招生人数趋势:# T; P- x1 S6 n0 O( Z6 c
(图6) ! x7 v" {. n1 ~" q1 V3 d w某年份的中学招生人数如下图所示:2 c" c" v4 e1 n: W# n; a; q. s
(图4) ; K7 n7 V" ]) M/ E 如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。 * d Q3 M, t" p% u# l 通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。! x. L) a/ T; F; Y& {
5.3.2 模型Ⅲ的求解5 U" M i. l, z* n) M3 z
对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,: F7 d y2 L1 a) y, P1 R' h
将带入得,,即为2013年高校招生人数估计。 & |( p8 V h( } C对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:, Z+ Y6 f4 q6 ^& S 将带入,得到,即3年前的中学招生人数估计。9 A. {! e% F; i% m
利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,1 C' U6 n1 @4 M: m- E
将,带入得。4 g' f7 d3 {% ?
模型的评价与比较 $ v- E2 Q9 U! a8 X# c; ^6 F 第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。6 j/ n) I2 C; ^* }
第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。 4 v0 T5 u9 X; v$ L/ N. A4 U 第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。; d$ V' S$ b3 F' ]. ]; A# Y K
在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。 z. g t3 S+ s$ u& ]
但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。 6 u. o6 L: l6 k4 A _/ g参考文献5 s$ B, b" y* \6 t' l0 H. v
姜启源,数学建模,机械工业出版社,2005年 , i' d4 M% Z$ L& t; o吴建国,数学建模案例精编,中国水利水电出版社,2005年" A. ?0 O% q3 |9 f0 E$ P
附录9 i, A8 Z1 K. K$ S
8.1 模型Ⅰ程序 3 s4 b, j) W1 L9 K2 Wx=1994:2009; * Q x' S3 [4 py=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65]; ( W+ Q9 r* |5 D) \A=polyfit(x,y,2);, H6 s/ F( {0 }6 I
z=polyval(A,x);& x) ~5 m: c m
plot(x,y,'k+',x,z,'r') ;3 V8 D1 U1 g! P. M7 e* Z
A*[2013^2 2013 1]'! X8 d5 S5 u; l4 |5 M# v
ans =103.0261 , Y2 R8 I+ [' X) n 1 I+ W; D) z& Y1 t# r, q1 l! ~8.2 模型Ⅱ程序 ( d ~$ _, y/ X$ xt1=1991:2006; / A& U; u4 {. G* ]* p8 v9 mx1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6]; ' B. m; B9 h2 @7 f% V* Q& s/ Iplot(t1,x1,'*') + v7 g5 i ?' ga=polyfit(t1,x1,2)7 R. @1 L) D8 |9 x2 M }8 m/ i
6 R; l0 m9 |6 d- Y
x1=[85.31 2.4862 125.17; & C) C- ^8 W* w1 ]5 N. O- W+ R96.87 3.2745 119.41; * e; r( {: k. q$ v105.22 3.0211 112.21;8 x# C1 k) J% C3 O" g
116.95 3.2972 115.88;2 y, E/ F5 y& q' { Z
120.41 3.5714 123.8; 1 d2 ~" R" ^; D3 u118.61 3.4308 125.02; 7 a% [3 L: @8 e+ P+ x3 a" O115.14 3.5023 125.52;) _) Q1 G& T8 P- Q `
115.3 3.6067 125.17; 0 M* Q( n( E! B' e115.58 5.7878 123.3; % w7 V6 Z8 \2 X) B: _115.88 5.7918 125.6;+ w/ Y% l* z4 }) I4 A
116.82 5.5036 129.17; 3 n! Q+ ?% m2 U- _118.14 5.5611 132.87;4 M" Q* m& T @: z0 Z
122.97 5.6544 139.14;& j8 y0 T$ u# p
141.95 5.6950 154.67;. ?; k. L* K, F
159.91 6.2994 167.06; - v, o0 ~- C5 o1 m' x1 l' P164.88 8.2410 169.69; * p7 o' o; H- h" Z5 D7 Y167.96 12.4817 178.19;; h8 n7 y% D Y) p
188.59 18.3553 201.28; " w2 R! N/ {. d- m* e8 U205.62 21.8719 222.2; ~+ x# j* h, q1 ^* G1 P* O& b% t222.82 27.3894 234.18;+ ?6 i5 j# M B0 K1 K* p
213.8 32.7452 220.94;: u, R- I3 {, P4 i+ a P+ s
207.29 40.0573 201.65;3 I6 X4 j2 ?! E3 \9 _
196.7 44.5034 192.94;' p0 ~: E& V+ E
191.02 45.3479 192.32;/ r7 w$ h& n7 C* F4 R0 E
172.88 51.4176 179.71;7 g' K" {% i- U9 {5 O3 Z
158.65 50.1082 164.6; ' J8 J Q$ ~) F4 S9 G]; 8 U1 l9 W2 F$ ?8 L7 `5 a0 I# [x=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1); 4 g K4 o0 |3 Q# S9 w[b,bint,r,rint,stats]=regress(y,x,0.05) 1 p) Z3 }# f! g6 X8 z6 M$ c) z; H$ {6 R' Q8 e3 m9 l" X; J( W
8.3 模型Ⅲ程序 % }, O+ M7 t d% u, N7 @/ L, zt1=1999:2009;+ o$ m, l4 @( ~. l w6 @6 l7 ^1 W/ ^. u
x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082]; . M9 T! I1 R" v* |" W/ Qplot(t1,x1,'*')6 Q* M! k2 F+ r1 |+ a5 t
a=polyfit(t1,x1,1) 3 q5 q3 o6 F8 Z# n/ F ?2 O3 W; a: ^6 a/ W
t1=1991:2006; ) b) Q b0 I6 E! i3 i8 z+ a: ex1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6]; ( y" E) C- b, K6 gplot(t1,x1,'*')! ^4 K+ _0 n2 @2 _1 {' v
a=polyfit(t1,x1,2)0 u" w0 l, [5 ]