预测2013年山东省高考生源状况2 Z" Z/ t3 z4 Z9 N6 E% }
摘要 # ^$ R3 ?7 _8 I6 J# F 该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。+ X* y6 f$ J: P. e. }
我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。 4 T" J# t$ f" E' Y 结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。 / |% c) G. M) U0 l, `5 j/ m7 A" l6 r 上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。 6 x9 k+ S B4 ` $ \; }% E. \4 P
' e' D' W+ ? j: { % ~% y' s7 X9 _& T 2 U! G! g, ]2 H
2 Z5 p8 R8 Y. U/ z 0 C- e. ^5 L. |$ ^
* k4 z; a$ @) q& f+ p
$ v, b8 V, d6 g8 D ' y( C8 R. ^! O
关键词:直接预测法 间接预测 模型改进 三种模型 误差分析 S5 _9 J6 r* ~
* o' \6 Q7 n) J' x F# S 5 m4 g/ `+ c1 Y, _" t5 b , Z! b, n) r1 }7 Q4 r" ^4 u4 _
5 {# S! h, x; \; ]问题重述 0 n6 m4 h2 \3 c; t" o" | 该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。/ i M+ _3 N9 Q" Y& J! {
问题分析' K6 r9 f7 l j
要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。 * y! ~5 q5 G( N; Z$ L! W1 V% M 对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。! ^' @: n9 J) ?" ~4 ~4 S" Q
模型的假设2 \% i& @, ?7 k2 g
表二所给数据为普通高中的数据。6 h# g% Y: o3 a, U# _% l
高中生源情况以高中毕业生人数来估计。* ]" B" V4 f b s& F0 O% m
定义及符号说明/ _) \; `( R* X8 [9 ?3 Z6 k1 l
:模型Ⅰ的时间变量;& @+ u9 m, C( m, r) f
:模型Ⅱ的对于高校招生人数的时间变量; : e+ b3 ]: J/ @6 w8 ~:模型Ⅱ的对于中学招生人数的时间变量;! w# y V6 x0 l4 v1 z8 D
:某一年高校招生人数; 1 x! c7 |) o+ l5 M# d# g3 v: W1 y& w4 u3 Z:某一年中学招生人数; . o' l; C1 M0 e0 L( o:某一年的中学毕业人数。 1 e6 l1 O2 Y+ U" t/ [& O( R模型的建立及求解 5 p6 K$ U7 X! ]" z# j2 p4 K5.1 模型Ⅰ的建立及求解 & _4 l# \! h1 {6 z: h; b% c 由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。2 ~, d$ {; V, N$ d
5.1.1 模型Ⅰ的建立" m0 }$ V- K4 D' `
提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:7 m" [: A4 a) H) C- J$ `
(图1)2 {3 u' l6 D6 g L3 f! B! k) j' _
由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。 . P# X2 I6 J: q, k- S; [# l 因此我们根据1994-2009的数据作图有:; d, h6 ?+ s# c9 k( i& M
(图2)* `) Y; i* ~ ~1 c. T5 B
对该数据进行二次多项式拟合:# h) _2 |1 \1 Y8 j
(图3) 4 N' X# m; k4 c# C( k6 c5.1.2 模型Ⅰ的求解9 W) o8 k7 H" {7 C- E0 I
拟合所得函数为:, C, r+ u- S! X
; ' ?* [# K0 M& U 带入,得到:。5 m: M6 ]2 O- T s, m
5.2 模型Ⅱ的建立及求解/ l* g8 ?5 d1 h2 O1 n! ]0 C
由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。 ( P% L+ j2 T; x# A/ Z$ [5.2.1 模型Ⅱ的建立 8 ]. }1 y$ p# @& y提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:5 j. {2 c# z. W D: u+ H/ X
某年份的中学招生人数如下图所示: 7 [5 N9 N' Z, n" W. f(图4) , t0 w7 g m# [建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:5 K1 I, b% P( K
(图5) 8 U8 [/ s9 W% X& I3 \' u5 d模型Ⅱ的求解* Y) K; y+ P2 [0 l
对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。 7 X t! {* ?& T% x, c$ m6 E7 k对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:; + @$ r7 F; b4 P! y, S! G将带入上式,得到:。 : i" Z# I: |% w; f1 t' k v5.3 模型Ⅲ的建立及求解 P- A' f& v2 L; p8 a 由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。! R; V4 g _$ [* P6 K4 l8 Q( _ s
5.3.1 模型Ⅲ的建立7 R. t+ a1 m. y: @& Y# ?( m
首先对给出各年份的高校招生人数趋势: $ a u1 P* q; \! s4 I(图6) 7 |+ z! D& i" j某年份的中学招生人数如下图所示:& _3 R' O) S! r- ?: a" E0 f
(图4) 3 |0 H& W V8 r" b" j 如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。 ' E0 O' V) P' |" e1 ?' Q5 q, ?- p4 X( r 通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。! G f) Z; g1 H# Q# Z) E" q
5.3.2 模型Ⅲ的求解 8 s. Z- F4 r& e: q+ l& H4 m对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:, ' P" ]; r* ~& I# U0 P 将带入得,,即为2013年高校招生人数估计。# x6 w' E7 f7 p2 {& P, o5 ^
对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,& q8 W$ X( X# C/ K
将带入,得到,即3年前的中学招生人数估计。4 [6 n& M# o0 N4 ~
利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,, 8 ~. L7 j4 i3 o 将,带入得。! T+ y D9 ~1 `' E' D [1 \
模型的评价与比较" ^ M4 o- g& ~* A
第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。$ a2 @* h4 f# B
第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。7 ~; p" ~& r; S0 _( j& x
第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。 / v# m- s! A+ y) @8 [ 在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。/ z9 H( T! W' j* G
但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。& t" o3 C- i9 C: \; g% a* ?1 m
参考文献- u; K" N! g4 R1 M! q
姜启源,数学建模,机械工业出版社,2005年 - n; F" @+ Q! L9 a% P/ ] f吴建国,数学建模案例精编,中国水利水电出版社,2005年 9 ]) p9 b7 g5 ~" H" d$ A: R* G附录8 o* `- l3 P/ ?0 ~
8.1 模型Ⅰ程序 : [ X8 U! V" J3 p& ~& s. [- zx=1994:2009;+ y! s; u, s' E5 W, Z8 k
y=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];6 k+ q" U+ V7 ], H0 ?6 U) l2 ?
A=polyfit(x,y,2); % w! W, j) W' h9 w: s* hz=polyval(A,x);/ R/ H6 w2 q# c
plot(x,y,'k+',x,z,'r') ;% o; I$ s: i% \3 [4 ]- \
A*[2013^2 2013 1]'5 _& q j3 _/ \9 i/ I; L7 E, _9 u
ans =103.0261 / @* m- X4 x/ I2 C% q& m6 b9 `5 S) }0 y% X4 f
8.2 模型Ⅱ程序9 H. {3 b3 x9 a/ ~; Q
t1=1991:2006; Q; f5 s1 h; F! h! j2 wx1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6]; 3 U# `. U! ^& _* [plot(t1,x1,'*')7 S4 _& b% G/ Z3 m! O X1 F) y
a=polyfit(t1,x1,2)! `: W. P8 W8 q6 Y) x, K
% ] }% l2 P! q9 ~
x1=[85.31 2.4862 125.17; - s4 ?. g, O, N$ |96.87 3.2745 119.41;* k3 C2 h* F9 \2 m5 H" [
105.22 3.0211 112.21; ( A8 P. ?% U& j, x9 Q7 O116.95 3.2972 115.88;* R) ^& l+ \- V- t/ p5 n
120.41 3.5714 123.8;8 ^9 o: k B9 v# u5 e9 N/ G
118.61 3.4308 125.02; ) L! w6 p7 F" i) b6 _% `3 {115.14 3.5023 125.52;4 c3 z5 K6 m" W2 O3 N
115.3 3.6067 125.17;3 Z7 T+ w* l5 Z3 b7 E
115.58 5.7878 123.3; ( O- u+ w% Y! v115.88 5.7918 125.6; $ W, z( K" S* E) A116.82 5.5036 129.17;% L: t3 e- S) R
118.14 5.5611 132.87; 7 b' M' B0 O: l9 X. Y4 i2 W122.97 5.6544 139.14;- ~+ S( d1 m) N: I. `' d
141.95 5.6950 154.67;6 A+ p: ]0 [) n' I9 g
159.91 6.2994 167.06; " J) W4 r* x: `% M164.88 8.2410 169.69; + i/ L$ l! F9 n( _ j; n167.96 12.4817 178.19;& g) _7 ]4 ~+ W; H1 U8 X; Y
188.59 18.3553 201.28; $ r. {& _* t9 H9 r205.62 21.8719 222.2; 5 z$ H8 Y9 y; n2 w8 T! @. q( _" n222.82 27.3894 234.18; % B; U N8 _1 M213.8 32.7452 220.94;. p, m7 b! e. u5 }! R
207.29 40.0573 201.65;( }/ _* h' f- I# N6 \+ X
196.7 44.5034 192.94; 5 ?6 O8 M' g. |7 X% {191.02 45.3479 192.32;! y- S) h R, i9 q! u4 N1 I& i
172.88 51.4176 179.71;+ _9 k/ x, I- ^/ C
158.65 50.1082 164.6; 8 m3 ]$ [* I; c9 d& k]; 1 \+ W1 N J _- K8 T+ }x=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1); & C' ~/ }& c$ ?/ ~( l4 m C) d3 \[b,bint,r,rint,stats]=regress(y,x,0.05) 4 M X4 n. N. a F# r 0 |3 o' \/ t, p+ j8.3 模型Ⅲ程序 8 `6 P/ v8 w$ T/ q8 Rt1=1999:2009;! l) [8 v- s. s; F! m) v
x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082]; ' Q# K. Y8 J( G S( J; O) w+ q9 Iplot(t1,x1,'*') $ {7 o7 U, A' K4 z+ |* e" Wa=polyfit(t1,x1,1) 5 r- H& C9 W- n6 h. X+ i , |5 H4 z& c T7 m) @t1=1991:2006;/ B+ k) i. u6 G. ^+ C! \! r! q% E3 h Y
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];4 t% D0 O2 M/ X% ~8 j9 _( P
plot(t1,x1,'*') ) }7 [" M4 D4 u* M/ J% O4 f2 Ja=polyfit(t1,x1,2)* C% z; ^$ ]6 g4 e