- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况& E2 k, ^) b& W* M. t) b
摘要
/ b7 H, Q4 K" B& t5 h 该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。
+ G7 j9 H6 f8 m$ E# C 我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。
2 p/ a( D) |/ U) Q9 t 结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。, ~! I; M, C+ W0 j, x
上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。9 G. r6 u7 X0 n' @3 A' K
$ i0 Y! q* T& P! I! p
; `$ C7 Q) Z5 ^
2 f, x9 X9 x- S" X: F& E4 K9 I6 ~. _
( x9 a. d& p$ y
( L2 g% ^) x& H8 {& C" z; d8 ], q
Q5 m! y+ O' t
" x+ A$ m+ \8 K) u/ p) I* o9 _
# ?* Z `. D, ~; ~5 k7 ? + a5 A2 a( |1 K; A
关键词:直接预测法 间接预测 模型改进 三种模型 误差分析' p8 Q% P5 `4 G0 e1 K4 z
6 _$ l c H0 d+ k4 H
, ]9 x4 N& K1 f$ I. F2 y) v 8 W1 U8 V# Y9 k( n7 t' `9 v5 k# _
Z/ \: J- K1 k6 I8 u6 S* v
问题重述( O7 ?. _! e% r B% m$ c+ o' [- q9 A
该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。% N1 X: ^. W! s- [: ]: a
问题分析2 S C) A' Z' P* A0 U* H
要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。, q* M- }5 D" H
对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。- u; G) x4 [" D' V4 F+ w% H5 N" i
模型的假设
' d8 `3 C) i( S; B& S表二所给数据为普通高中的数据。
3 c/ ~- Z+ |$ `+ E2 X( {9 \4 f高中生源情况以高中毕业生人数来估计。; }# n) ~% ?5 y+ c0 E+ K* U9 z* @
定义及符号说明
8 { ~ k: j' @' G* u:模型Ⅰ的时间变量;
( g2 Z$ q# G# ~8 f }:模型Ⅱ的对于高校招生人数的时间变量;
3 Z4 f/ B3 o) d- p:模型Ⅱ的对于中学招生人数的时间变量;
8 I, S3 V' W# P3 G- ]9 ^8 c- X:某一年高校招生人数;
. Z& m- O u) E3 ]:某一年中学招生人数;
4 h2 X: V W- o7 I$ J:某一年的中学毕业人数。
: a$ n0 p2 c% \1 ?模型的建立及求解7 }* P( M0 _* |7 j0 M
5.1 模型Ⅰ的建立及求解
6 V2 K# D! }( i* J: s; P9 u 由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。' f( `' e6 g4 u3 \+ r, L7 O
5.1.1 模型Ⅰ的建立
1 ~1 K1 B; l2 {2 \+ w 提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:0 e% I* J3 s5 b' z" A# s: f8 r
(图1)
5 x! `' B1 O2 Z P4 e) j% N6 _; i$ M 由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
1 _. x3 o w3 H+ ^/ ]( q9 W+ k 因此我们根据1994-2009的数据作图有:
9 I2 M9 u: A& E* T8 Q (图2)
c5 |5 d3 O: x% `9 L 对该数据进行二次多项式拟合:
" Z1 k! u+ n* {1 v, E6 I (图3). m, x$ z7 u$ ?0 U% R% x9 S
5.1.2 模型Ⅰ的求解2 @1 U1 u1 |8 e6 P H
拟合所得函数为:3 ^1 G8 b9 {9 b) P: Y
;
- g/ e2 W+ P" P' M6 B 带入,得到:。
, k5 ?: P- K2 i) p9 w5.2 模型Ⅱ的建立及求解5 Y n& V* C! |: [
由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。 ~/ s/ d8 b# V! [5 E ^. U
5.2.1 模型Ⅱ的建立
" p% r" T2 `+ ~提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:1 p6 e- o4 k7 b5 s0 f
某年份的中学招生人数如下图所示: t/ A6 N$ Z a0 b( P
(图4)
+ K( r% U s" k2 X. ]; C2 k建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:! w+ m( Q- \' D# L M) @
(图5)
3 a; m% W6 Q8 Y. R模型Ⅱ的求解; Z5 o I: l: ~
对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。; j- m3 G. }6 K
对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;) W5 k4 Y& L& w
将带入上式,得到:。" F X! S: T o5 }" ^
5.3 模型Ⅲ的建立及求解) }) [% u( K ?$ p0 J+ R
由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。
6 ^( @; ~2 g$ C3 t$ x9 l5.3.1 模型Ⅲ的建立
3 \. U8 A5 z+ j- S* y" m5 o: G- ` 首先对给出各年份的高校招生人数趋势:" i8 w. l. v1 g( m. l( \
(图6)
5 I: e. v$ G9 Z5 c9 Q: U) p n某年份的中学招生人数如下图所示:
5 d, b) P7 Z5 e! ?7 k2 j% X(图4)
! ~& }- x b) E- ~ 如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。
6 q( [6 Y' J5 r3 h' V 通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。( |, Y; t! v& j; @0 j6 e5 R+ r
5.3.2 模型Ⅲ的求解) {& \ I) _' [9 x
对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,
% U5 b' ?% _" x/ B3 R1 }! i. C 将带入得,,即为2013年高校招生人数估计。
4 h- B( `2 E0 p对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,
2 X2 W" j* ]) `" [; D 将带入,得到,即3年前的中学招生人数估计。! b! _! ^. |5 I9 s6 m: a
利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,1 U3 n( f% A; g9 T
将,带入得。
, J$ @ e# T/ z模型的评价与比较 a( ~- Q0 i, E9 m; d
第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。
/ R. e: T5 F0 h# g) y5 G m 第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。
2 i2 Q8 o1 F* u$ I5 Z 第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。
8 r6 }' F8 w5 {. y2 P( F 在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。
9 m/ s3 l( O5 z2 z7 N 但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。9 Z6 Q% K5 R1 N
参考文献# x' B: I4 v8 v
姜启源,数学建模,机械工业出版社,2005年
0 R9 T/ V# S4 D' |' n" T$ }6 @; c0 Q0 X吴建国,数学建模案例精编,中国水利水电出版社,2005年9 y! q8 \1 k6 [/ [
附录% {8 V4 r5 z, i8 H
8.1 模型Ⅰ程序+ g* d- o9 \& [7 A" P
x=1994:2009;
1 m2 e+ p! c9 j3 g- }3 ` j( ny=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];
1 c$ ?7 h0 v5 \/ QA=polyfit(x,y,2); C5 V' i+ u% L/ [
z=polyval(A,x);5 L0 }! q Q; p( J, g& w) P8 u
plot(x,y,'k+',x,z,'r') ;& k& ]9 d$ w1 b/ b0 i
A*[2013^2 2013 1]'1 h( u9 K& R! B9 |5 ?6 g
ans =103.0261
# W! V& Z0 l1 Z M# B8 I
6 ?: g }+ r4 I6 T" o8.2 模型Ⅱ程序 n0 m! u) w2 l8 }% D' c, D
t1=1991:2006; c4 v+ q* p3 d: c: ]* s
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
) x! L; e0 z* X- }+ b: _1 Aplot(t1,x1,'*')
$ J9 a2 E2 v9 ?a=polyfit(t1,x1,2)" Z, d" w$ V! c( G
( z9 C) b4 h* V' Px1=[85.31 2.4862 125.17;
! _ ~, W% I$ e- t, W, \96.87 3.2745 119.41;: x& T" c6 L% L! b( ~
105.22 3.0211 112.21;% Q) X8 K3 G z& C2 M; P
116.95 3.2972 115.88;& L0 g2 b2 M+ @# k0 g* `) a
120.41 3.5714 123.8;
8 V# k7 K9 N3 U118.61 3.4308 125.02;
2 z% v/ s1 F$ y3 V B115.14 3.5023 125.52;1 {/ k) g( e7 `( l+ |2 K5 }
115.3 3.6067 125.17;
' V G N. B8 s( n, B115.58 5.7878 123.3;, ~4 D$ h E& r6 K
115.88 5.7918 125.6;
9 q% z, h7 K2 u1 U( U5 n( @116.82 5.5036 129.17;/ A: Z) t1 E/ l2 Q4 _
118.14 5.5611 132.87;
0 x, o- O6 W6 Z( j% k# R! Z122.97 5.6544 139.14;
# m P& P4 Z% X% Z- {141.95 5.6950 154.67;0 h5 s; B D1 I
159.91 6.2994 167.06;0 B/ C z% T3 c" m" w$ `% M& e4 }& ?
164.88 8.2410 169.69;
+ g# q! n& |1 N167.96 12.4817 178.19;, N( L1 L; S# J6 ]. k3 E
188.59 18.3553 201.28;% ?8 L) _/ B3 k+ c
205.62 21.8719 222.2;
- M5 i3 t" k+ s- c8 Y4 `7 _8 |222.82 27.3894 234.18;
3 y2 M% s; n2 t' d213.8 32.7452 220.94;
$ ^ T$ ?3 P* y207.29 40.0573 201.65;8 c9 I M K9 y
196.7 44.5034 192.94;
3 O+ `- w2 N5 n1 _; ?/ X191.02 45.3479 192.32;
. R% @' U9 {4 A. {# M5 T8 O172.88 51.4176 179.71;! X: ]7 K4 K* V4 V7 L
158.65 50.1082 164.6;
w$ K) H$ T' J% i7 v) M];) x0 d5 @6 f% q4 j: S# R
x=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);
6 f+ w1 O5 _7 t[b,bint,r,rint,stats]=regress(y,x,0.05)
/ }9 D. U5 B; H, b: w/ S1 v* y' |. M* W+ m" M/ [
8.3 模型Ⅲ程序% Q2 b% }3 O* } S6 B
t1=1999:2009;2 F* Z2 `/ v8 p+ c; ~% _# Z( x
x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];
+ L1 l1 O& l6 A! d, r3 Zplot(t1,x1,'*')- ]5 Q& s9 ^+ p4 e, q: U4 d, Q
a=polyfit(t1,x1,1) c, K2 f; g; W+ `
' D' ?1 P4 O( } y0 Zt1=1991:2006;
8 m( n+ }0 H& h9 a( |) v9 _x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
2 Y" j: B& j9 o* Xplot(t1,x1,'*')
6 W3 U/ @5 a& f- R2 j# \a=polyfit(t1,x1,2)
0 C. d+ v1 t% W |
zan
|