预测2013年山东省高考生源状况 3 s; p) A2 X0 u, F' }& i摘要; L8 h h7 b+ S
该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。 # I, S# C( Q# k# S1 I) T& z 我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。 5 K C8 S4 ^4 @ 结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。4 U% s; Q1 ]' t' Q5 g
上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。4 V7 w9 @. a( I ?$ m0 z
3 g1 b0 o. o, f/ }- {$ G" b
+ Z: H% j; w% B: M / R% u$ h% K4 ~7 R8 e 8 Y9 n% n2 g9 o
0 B8 l& i X% l- O4 X / S2 D, D4 m1 O/ z: S
% u: P* K Q* ^+ ]6 K1 |
) T$ p' q1 T9 ^, a3 O) ]8 x6 a+ E $ R, Z$ L5 O, y1 R3 U4 X 关键词:直接预测法 间接预测 模型改进 三种模型 误差分析 0 x$ }. A5 H7 t. k0 S6 u 2 l4 j. I6 p2 y; k5 X, @$ v$ u
+ p" j2 @4 q% l8 g: } 3 C# `% X. N6 P& m+ a @1 `: x( k/ X/ r: H$ r) ~
问题重述5 p$ L; v- ^6 M( ^4 m+ Z1 g& D
该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。 - A, `" t* i5 k6 H3 {: J! I问题分析 0 @* Y' d2 E- {; P5 z) @+ Y) \ 要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。7 M) h" z7 r) y- D$ n% z: e. p9 s
对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。6 M _* T) S K( f# [) g
模型的假设6 l% M; m( M% ~/ M
表二所给数据为普通高中的数据。 & s, Y5 |( G [$ p; `; `高中生源情况以高中毕业生人数来估计。1 P: h( }" `9 k/ _, r7 J
定义及符号说明" L+ Y) V2 Q4 H! A# Z
:模型Ⅰ的时间变量;9 d6 {, r7 x- B4 V
:模型Ⅱ的对于高校招生人数的时间变量;: a' X4 w9 U+ i4 j; O/ Y" G/ i
:模型Ⅱ的对于中学招生人数的时间变量; ; |. |8 P; y# Q0 i6 T9 [: {:某一年高校招生人数; ?6 B9 N, U9 g8 O) }:某一年中学招生人数;& x ?! j9 `7 S2 P
:某一年的中学毕业人数。% b @7 e' E/ c" L- B6 i; A
模型的建立及求解 % ^! f* _! p7 J# O" s5.1 模型Ⅰ的建立及求解 % x) v+ y/ @8 S 由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。1 t+ t4 X# q1 `% L2 j* f& f
5.1.1 模型Ⅰ的建立 & l( k( f4 i% G" j5 u& t8 i' n9 b 提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得: 0 n) ~6 @ ^+ A3 y9 \ (图1) 5 @& z! k" |, S+ x' k: ?7 a 由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。. |7 \4 v& d% l# p) H1 |
因此我们根据1994-2009的数据作图有:) n2 \; d. |- g& e+ K& r# z
(图2) v0 d$ `8 `/ N1 I6 x
对该数据进行二次多项式拟合: 4 E7 z4 c% Y, w (图3) * H7 V3 H0 B- _5 n; d# x7 L3 C5.1.2 模型Ⅰ的求解) N2 e9 A+ ]$ T" B7 q. `+ a6 L7 t
拟合所得函数为: ; ?9 q1 `7 @5 Z) q& M( y4 M4 n ; ) X' A2 y6 E0 i. _, G. X1 N4 V 带入,得到:。' k8 K& i* [2 e# u [( e. d+ H
5.2 模型Ⅱ的建立及求解 . u* E9 M/ l3 e( Q% B 由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。* E6 a+ W4 x: D p
5.2.1 模型Ⅱ的建立5 a/ Y+ v7 S) ~# z) M
提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得: 3 w4 S( x( N( X7 I) _某年份的中学招生人数如下图所示: q) a: E$ A# r* I( d6 Z(图4) " E1 Q# B5 _ ]建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到: 5 ?5 o, e: e$ S% k8 o(图5)7 D4 S" J- l& I( o4 ? {5 R' N
模型Ⅱ的求解 1 }9 H* r# R$ w7 Z对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。 : k+ v7 Z5 D, \+ j7 `: L& c对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:; % `" o7 L6 _% S4 [将带入上式,得到:。" I6 i7 z, j& O$ }4 U
5.3 模型Ⅲ的建立及求解 & ]" o. R8 j+ Z* `$ J 由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。 ' ]4 P6 J. V# a( R4 }4 s) r5.3.1 模型Ⅲ的建立 2 t( ?; X# b* j. `% d' x% J 首先对给出各年份的高校招生人数趋势: . K. }6 D; k$ U b3 Y+ R(图6)2 [5 {, L3 Y% d2 E
某年份的中学招生人数如下图所示:3 c( {" b. B1 [3 N: J9 B7 k
(图4)) O& d8 D- F0 D. A* k. Z
如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。 % K& ?+ }+ c7 a: } 通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。2 Y Z3 U9 c- B( m) @
5.3.2 模型Ⅲ的求解# g x9 ^8 c) `7 u2 t& z" l% F7 b) U) V
对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:, 2 S# V) r( b# h P5 ] 将带入得,,即为2013年高校招生人数估计。 A, |4 x* n9 v对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,4 u1 h" c' l7 I
将带入,得到,即3年前的中学招生人数估计。 * I6 B/ M, p* m, t8 B8 v利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,, ; E- B. N9 X. M( g& T" A9 y 将,带入得。 2 @6 B2 p+ D+ ^4 {) o- T4 ?# T模型的评价与比较 u" O% _: x' [) \: G L% ~+ _ 第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。* _ F& c" {% V1 b7 _0 x
第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。 ) K: H6 @' t- ?5 u6 L7 s+ | 第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。1 ?% n- g' O2 @8 ^1 Q# ~
在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。 ' h. Q/ T# `7 y7 B; v* J1 ~ 但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。 , B5 f3 S: w' o# |# ~参考文献. i6 W9 a" Z# B! y
姜启源,数学建模,机械工业出版社,2005年 ' Y" D2 f& p4 b- m9 q! k2 C吴建国,数学建模案例精编,中国水利水电出版社,2005年 0 B/ M) u* D2 T O$ }# Z附录 + B8 b, W$ R7 T/ j3 I8 `$ e8 \! U8.1 模型Ⅰ程序: C1 g4 _ a9 H F
x=1994:2009; . p2 c4 @% W# j$ Py=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];( C" d9 v5 B3 f9 E
A=polyfit(x,y,2);# _* B- g& l5 s1 I% H9 c. I
z=polyval(A,x); 3 D" D8 o; `# h+ v* Q% p1 uplot(x,y,'k+',x,z,'r') ;0 Y+ O! ~4 b1 V( S
A*[2013^2 2013 1]' 3 j% r( T; c0 O7 ^7 q5 qans =103.02615 k, @; N$ I0 @* z; L9 R. F3 ]
, y* }! C8 D- j# c7 ?; g
8.2 模型Ⅱ程序- p3 k6 e8 d: n6 u0 Y2 V+ L
t1=1991:2006;. X5 K7 e& Z2 q% d1 s4 E
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];" i* g+ L8 S6 i
plot(t1,x1,'*') 7 V+ H; L3 M" ?. Na=polyfit(t1,x1,2)* G) q6 K& r& o9 u
$ a- i5 p! Q8 `( K: g/ w! j, ^
x1=[85.31 2.4862 125.17;0 F1 E: j; g6 e7 G
96.87 3.2745 119.41; : U+ h) j( [% t2 B1 B2 V105.22 3.0211 112.21; 0 j+ [7 `2 P1 P! @% y9 i! S116.95 3.2972 115.88;4 ~2 K8 s0 E# r8 ~( v
120.41 3.5714 123.8;. ?1 |8 ]0 e5 X( M9 e. U
118.61 3.4308 125.02; 9 K2 N0 @$ c. U T8 |" N! c& S115.14 3.5023 125.52; , {0 z: f" ?! @7 X5 j5 w% A115.3 3.6067 125.17; $ d2 l, \! Z! k( n5 `4 R" g115.58 5.7878 123.3; ) q5 d0 ~1 R( o _3 `$ e115.88 5.7918 125.6;" [( o6 Q; P4 M. S! [ i
116.82 5.5036 129.17;5 w# x. b" Z0 H# B4 t! G! v p
118.14 5.5611 132.87;9 I% {" j. @4 ?" q" L
122.97 5.6544 139.14; 5 ~) p5 I/ B4 C7 z: Q7 Q141.95 5.6950 154.67; b; b8 k& f0 ~& y! k! x3 S159.91 6.2994 167.06; . \! {+ ~/ ~( D. p- h164.88 8.2410 169.69;/ @" U. A! g7 Q1 ?* g
167.96 12.4817 178.19; 7 R- w% ?% \! `: M3 h v: u! s188.59 18.3553 201.28; # w4 ^9 C5 m4 s' p6 e$ ~0 {205.62 21.8719 222.2; ( r1 }& u/ ]: B# y4 |222.82 27.3894 234.18;! v% F" q5 R, U% X% ?
213.8 32.7452 220.94;& ]% N2 n. P- Y8 p
207.29 40.0573 201.65;, ~% ?' O! u A( S
196.7 44.5034 192.94;* M# J5 x+ C8 R9 A+ ]( W5 f5 z F
191.02 45.3479 192.32;6 ^, U2 j9 ^$ T N/ O/ E
172.88 51.4176 179.71;. u# R1 C8 X8 B( P
158.65 50.1082 164.6;: r* q! `, [$ ]9 O8 @. o
]; |8 d& k4 K( jx=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1); ( M3 o' L" @3 P+ r. a; A* r/ _[b,bint,r,rint,stats]=regress(y,x,0.05) 1 ]+ g4 G( `; D" {, g 7 _9 ~5 u- w5 c2 h: k- f- z! W8.3 模型Ⅲ程序 3 i* F0 Z' c) P4 ^4 X t4 T4 gt1=1999:2009; 1 G) O2 y( C: a2 W% Y0 px1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082]; - k, w# f3 t; u: W3 }) Mplot(t1,x1,'*')' }8 ^3 h$ c; s' I
a=polyfit(t1,x1,1) % m+ H# S6 l5 t, }1 x7 }7 ?; N. k2 u 3 ~, v2 f* u; w( y9 S$ i6 f0 nt1=1991:2006; , O6 b5 `) C+ o1 a2 e B2 @x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6]; 3 ?% m! N1 s% y( Y: `* Qplot(t1,x1,'*'). O) P6 g p9 L1 u
a=polyfit(t1,x1,2) 5 k0 T3 O% I9 V$ }7 c% O; M