- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
|---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况
: P2 v% H" f- a+ C1 d6 C. l摘要
. W/ [- n7 i3 X; I 该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。7 @& D; l$ G) C) I- j
我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。
; D' k1 v) C0 v( Z2 s* n |0 H 结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。
8 k; f) n+ i+ a3 B- p( [: V: K0 d 上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。" `' k" \9 ?2 [+ c9 k0 ^! l
- e2 k1 y$ m! ~* W0 W6 Q2 ^+ @ Z : m( T2 a' R' k+ V( ]1 i; N
7 c5 v: k9 ]' K, a6 p+ ~$ ^% B1 M
8 m. ]2 i6 N; U; g) R , o7 b- h7 E6 O' Q/ p0 o2 G
8 l" ]! N: w, W: c! u/ ^) g( U
4 r4 v, l p- X' {9 J& h, W$ L
2 y/ S- J. [2 ]8 g
# Y- D4 C; W) s& y; r, g 关键词:直接预测法 间接预测 模型改进 三种模型 误差分析- _$ w3 B3 r6 b7 V3 ]
( F, R6 r9 y+ ~* Q+ F+ J! _
4 h# }" Z! c) l 5 ~ H, D3 N3 M ?; r/ e
9 {1 v2 {# q9 K2 x8 ~
问题重述* U. S l: o9 f( G7 R# k
该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。
" z' \5 @% M7 F; M问题分析
?7 P8 D% A$ S! C1 i 要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。; ?0 V; A+ z& Z6 k" f6 h
对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。2 Q2 @+ s' M" Y. Y. b/ ?' e
模型的假设5 o4 ?/ Z- |2 x- d, |/ D
表二所给数据为普通高中的数据。9 k' ^, {. M4 R3 @0 x
高中生源情况以高中毕业生人数来估计。7 y9 w; U5 n% H
定义及符号说明% q M) u8 u! Q; W# t; F$ b2 q
:模型Ⅰ的时间变量;/ z, k! l) }' N: L# n
:模型Ⅱ的对于高校招生人数的时间变量;) S1 V$ E% h! Z, {: ]
:模型Ⅱ的对于中学招生人数的时间变量;
5 F/ g6 U! M5 Z3 O4 R7 B- U& I:某一年高校招生人数;
. B3 p2 h- T0 g, b$ _:某一年中学招生人数;; l) w; b1 @! F& S( M2 ^1 Z
:某一年的中学毕业人数。. \! @; l) Y. a4 A+ e4 i
模型的建立及求解
$ v+ l, H7 u3 R# u4 s2 l5.1 模型Ⅰ的建立及求解
; n0 X( F+ p4 j" ~ 由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。
6 k& A* ]+ Z G/ k- e% Y3 G% W5.1.1 模型Ⅰ的建立
0 R ~7 \0 A$ G% ]; X 提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:# }$ B0 d/ P2 I3 O* }$ L
(图1)
. D% Z x4 D0 r 由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
- T1 r" I, R3 D2 U+ w) B 因此我们根据1994-2009的数据作图有:
/ k9 w* D1 A5 ~, m. q (图2)( b: \% E$ j/ E- X, N% v. ]
对该数据进行二次多项式拟合:6 h _# z- E8 B. E
(图3)3 @! t+ Q9 T6 |( T
5.1.2 模型Ⅰ的求解% B; v* S# ~5 \3 w* x
拟合所得函数为:
+ b8 g9 o6 W1 D; {9 B1 _- J2 Y ;
i0 n+ l2 E5 @+ l" i) b- K/ X0 I9 f 带入,得到:。
9 T: p3 I( _9 X5.2 模型Ⅱ的建立及求解) w$ n: U8 [/ k+ }" l8 y
由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。9 ?; b. t# F, Z* z
5.2.1 模型Ⅱ的建立
# R: X; x& y" \ T+ E% t' u提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:. f* s6 f$ Q% a4 {7 j) d
某年份的中学招生人数如下图所示:
9 Q8 H, L$ {: _5 p- c- ~; p(图4)
0 Y; r2 D3 n) ]. M( c1 d建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:
+ L: u* Z2 K( L5 b0 Y/ E/ _0 ](图5)
, J9 ~' C) `5 S2 A; ]3 A模型Ⅱ的求解7 W5 U ^7 n. q( l4 ?& m# r: g
对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。
1 q; A' |. `! Q1 \对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;
) ?" {4 T5 x# u7 q3 R2 w* ^4 i将带入上式,得到:。$ o* v6 g. B: k* `7 w
5.3 模型Ⅲ的建立及求解# r' y+ s( U, ^# \ N; A( p
由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。# W! A2 [9 _- J0 D: q0 M
5.3.1 模型Ⅲ的建立
% b# {! X' K8 E 首先对给出各年份的高校招生人数趋势:) F2 s- S9 v' E4 k! j: U& c
(图6)
5 b- r: ^. u% b7 m5 w4 l/ K某年份的中学招生人数如下图所示:( L0 G- V4 }2 |1 s) h% u" M
(图4)* e( C; a% u0 d* B: J2 L2 w
如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。$ s$ _9 m* Z3 g8 x
通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。
# @ ^% x4 i5 M5 `: v: M5.3.2 模型Ⅲ的求解
; X# { l$ e8 }6 j对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,
- m* b- k8 P+ v {) o 将带入得,,即为2013年高校招生人数估计。
4 T& L5 s5 Y$ z) d4 Q对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,
& Q, Q% H& L5 ~$ G' ?# W 将带入,得到,即3年前的中学招生人数估计。
: h: g) ~9 p. z/ }3 y9 Q利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,# I0 M' ~# R5 `' |9 v1 x
将,带入得。$ A3 C m* i7 N/ d8 \1 F* t
模型的评价与比较# l2 i# g/ [% E9 f* e. Q% I
第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。
+ R P! {0 f$ A+ O" t; P6 C7 J/ S 第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。8 k1 p) E! j- E* X6 r! `, Q/ {
第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。1 ] k0 W+ \5 ~6 s* W( A3 e! y1 o& O
在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。
0 l; I [9 h% r 但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。
4 G1 M; I: M4 m E4 s3 h4 ?& a参考文献: ]7 V v# q6 ^3 b
姜启源,数学建模,机械工业出版社,2005年
: R4 S+ d7 x0 n6 w) V' D' l吴建国,数学建模案例精编,中国水利水电出版社,2005年4 g8 I; Q8 T9 d1 q7 F
附录8 S7 ~. U2 K8 d! a2 c! X
8.1 模型Ⅰ程序
- T9 l7 ]5 E& O/ C1 n) Hx=1994:2009;. s0 M+ {, |4 j% S- f
y=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];
) `6 _0 A, s ]! e4 _: IA=polyfit(x,y,2);+ @) T/ W! o; Z; W: M
z=polyval(A,x);" c) |8 f4 O* h( i7 p5 @8 c
plot(x,y,'k+',x,z,'r') ;. a( A2 o* }% H
A*[2013^2 2013 1]'4 i6 C+ s z1 {" d' i8 ?6 ]
ans =103.0261& }4 Z1 r* h5 Q; V- Q' B! F
5 c% k+ ?* x) \* P9 {5 } P! Y
8.2 模型Ⅱ程序: G% s% m( D5 H$ n6 S
t1=1991:2006;
& ]- o j6 x; Z0 @3 b- n: l! W: Q4 \/ ox1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];; L k2 n' Y: q- N+ X/ t
plot(t1,x1,'*')5 d. E9 R( b4 r! k# e M r8 O! B
a=polyfit(t1,x1,2)
$ I6 p R) O: ~; t
% M, A; q4 p" i5 ^2 f6 Jx1=[85.31 2.4862 125.17;
5 H, X3 d, i4 \2 \ M% K9 J96.87 3.2745 119.41;
+ l- C* R* ], r$ \9 \105.22 3.0211 112.21;
* F5 w! Q% u2 Z- t116.95 3.2972 115.88;
0 `6 d- R) o$ S0 G8 H; R0 V120.41 3.5714 123.8;% V$ m4 Q& Y3 W0 t6 m7 |9 |$ ^
118.61 3.4308 125.02;, }+ N, F2 q }2 ~5 O, v
115.14 3.5023 125.52;9 V& e4 a ?+ y( ^
115.3 3.6067 125.17;0 k7 R y! n' f2 \( A9 W7 T( F: j! s5 [
115.58 5.7878 123.3; q$ }0 @$ _! ^6 O2 W- R( q
115.88 5.7918 125.6;) W% @! f) K! q* z1 Q" S( {
116.82 5.5036 129.17;
6 d; P ^: [8 c9 W$ Q6 J7 p118.14 5.5611 132.87; r# q! C2 T" n) R
122.97 5.6544 139.14;
8 i- M3 ]* o, s0 v0 g141.95 5.6950 154.67;' ^7 P. K: \ N) J$ w1 s; {
159.91 6.2994 167.06;1 }1 F# U; B7 M; L! B* Z
164.88 8.2410 169.69;
0 z8 D& X( y1 M4 s167.96 12.4817 178.19;1 X6 L/ F; e6 B
188.59 18.3553 201.28;! [* {* _# W. L( U
205.62 21.8719 222.2;8 |8 a7 \! t, y4 z: c: @( Z$ a
222.82 27.3894 234.18;! ]3 k/ c4 e7 t0 [& k
213.8 32.7452 220.94;% V9 Y0 O. H' @ C4 z
207.29 40.0573 201.65;: g* [( m) Y% o D0 I+ c
196.7 44.5034 192.94;
# T' Q9 P/ u6 D191.02 45.3479 192.32;
) o! c- u% H, h% S172.88 51.4176 179.71;, G! @# F, s0 K( v. p+ g
158.65 50.1082 164.6;7 G) g4 S {+ @9 w
];
0 t+ Z* n) a# `7 l W4 [1 o/ Fx=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);& A( n2 y3 h8 i. e3 r" p
[b,bint,r,rint,stats]=regress(y,x,0.05)
2 j3 M% [; ~* Q" a! M; r" U
6 U/ n9 }' Q0 h5 t" j# T, z% q8.3 模型Ⅲ程序% O% h9 \/ E* v
t1=1999:2009;3 c+ K% B% [0 l" [9 O* N* V$ y2 c
x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];
" p, ~3 [$ ]' h) E, i! p9 splot(t1,x1,'*')
1 X9 j* n8 D2 |7 [& Y [* G1 N$ ma=polyfit(t1,x1,1)
* |3 K8 k7 J/ m9 A1 X4 E) ?
! N1 K/ Z v( }0 ]+ w" Ct1=1991:2006;
9 b, }- q8 C% T6 Mx1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
( \$ k$ q3 N& Z! }/ aplot(t1,x1,'*')1 Y1 F) A% q: J+ x: s4 m6 y
a=polyfit(t1,x1,2) }0 e7 }3 `1 S+ N
|
zan
|