- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
|---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况
5 j; c ~: r# G摘要
5 l0 a9 v' m% `: G: j 该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。
: X. e! G0 n2 Z 我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。/ ] `. Y; p1 c {
结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。2 g/ P, O4 L9 q5 A& v. @
上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。
1 s; j& F! l8 d$ j3 ~) |7 @$ m1 q , p- ? L/ f4 @4 ~2 |. ^
}0 D) H* ~# H) e" b7 a( C % U6 S& K. M. R( U% @
- H# \5 B6 r0 P) `# g* a
, p8 c7 Q: d) O0 } B0 k1 b) H ) m$ q" w3 m3 W9 t1 M
* h/ g, d; S2 i8 T! a* C: C% m9 }
& W/ F: H1 O q: \. z$ w. f) \
2 Z K9 p: E- |* @" p0 `. N
关键词:直接预测法 间接预测 模型改进 三种模型 误差分析
1 D$ }- o7 z8 C+ }7 Q m* f
' b, k0 W9 h( q % N4 o3 }, S/ `2 F5 |6 Q9 P
" N* v: H2 V# H. \2 N9 s4 j: a5 ?
问题重述" {/ Q( x$ Y4 @; j: {
该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。/ G, |; R6 f# M! T- P) q
问题分析
+ B( N0 l L6 C4 h+ |( S0 P: B 要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。. X: }) ]- |. Y- U
对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。
' s- b% }, q0 w模型的假设
, J% y5 v. a: Q1 ]$ Q4 F: l表二所给数据为普通高中的数据。( w5 E7 t1 H3 W0 v! ?& H
高中生源情况以高中毕业生人数来估计。
" i' _7 T; v$ p定义及符号说明& O: p0 m7 E: x/ A7 ^
:模型Ⅰ的时间变量;2 V! O8 H7 v1 n+ e1 a9 W: t
:模型Ⅱ的对于高校招生人数的时间变量;
$ q4 h: `1 d* q. T) k- V:模型Ⅱ的对于中学招生人数的时间变量;- k: w$ \" a$ f& X: a1 W
:某一年高校招生人数;8 A2 i; p+ [" l- s
:某一年中学招生人数;, A6 P: x9 I3 }6 @! Q# y4 L/ n
:某一年的中学毕业人数。0 Y4 E \8 v& D7 w
模型的建立及求解
; z, `+ U/ g' O- L4 n8 H5.1 模型Ⅰ的建立及求解9 `" u f0 |: g* f4 y% ^* }
由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。
& q1 ~& m- K5 L5 G5.1.1 模型Ⅰ的建立5 O1 F: s& e" b: g% o% d" ^
提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:
9 F; D+ z d% a6 j (图1); H0 Q; [# e5 ]/ U6 v/ l6 x
由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
1 `+ ]' \, l7 _: I7 R 因此我们根据1994-2009的数据作图有:+ k$ x" J' D% J+ Z6 {3 j' h
(图2)
! B$ D6 e% q9 ~: C/ n 对该数据进行二次多项式拟合:
: B; Y* B6 V5 R- O5 s( c8 O (图3)! v! D6 {* o) C" h* Y6 L8 r8 z; O1 X
5.1.2 模型Ⅰ的求解: h, D- `4 }& |: d- u
拟合所得函数为:0 L3 V1 e* w/ x# J& ^, o! u! P
;
5 s+ e$ ~( M/ Q$ O# r 带入,得到:。4 B7 Y7 K) p5 Q% e, i8 R* Y
5.2 模型Ⅱ的建立及求解% z. t0 S( L& L# ]' H
由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。
5 j4 Q6 k& W% L/ X8 A4 o# n. t! s5.2.1 模型Ⅱ的建立3 \& @8 X" B8 S: n; ^( ?+ l
提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:
3 U% `6 t. P! ^$ S8 W) B+ E2 T某年份的中学招生人数如下图所示:
9 K$ l4 @6 z6 [9 U(图4)4 M' f+ H: I# v' \7 ~
建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:% ]% d: B' d1 d( l: k2 }7 h# e n
(图5)* x( F: x2 x4 s7 f1 \
模型Ⅱ的求解7 L1 _+ t$ a$ J7 V& F S
对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。
; n6 ~' z9 G7 @# c. l对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;
) d: @2 T1 L( `" N1 B2 g将带入上式,得到:。' ?. o$ z2 V( ~" s4 B# _& F
5.3 模型Ⅲ的建立及求解2 c) d' L( k: D+ p, t. T
由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。* w. |) D9 v2 T# h" P7 w
5.3.1 模型Ⅲ的建立' a" ?$ R6 T/ k \: Y
首先对给出各年份的高校招生人数趋势:/ p/ n, K. z4 n% `2 I
(图6)
. c6 j' {8 O: b- d0 f某年份的中学招生人数如下图所示:6 W( e' Q/ c- y) Z; o4 f# ]+ h" x
(图4)
6 x; b2 Q% m% b 如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。9 B' {, I3 l; D4 A, G
通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。4 W+ e7 y, e' {' W
5.3.2 模型Ⅲ的求解# ^' Y. Q: P+ }8 ]) z; _
对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,2 u4 |: ]. ?; L- l) \ k. U
将带入得,,即为2013年高校招生人数估计。
) n1 z2 s, ?, x ?3 _2 o/ |1 m1 R" T对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,6 J' b1 D5 N1 J. B2 I# F, d1 \
将带入,得到,即3年前的中学招生人数估计。0 u: J# N9 u, A" K
利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,6 b$ W+ N( J9 z4 K- `3 k
将,带入得。
% } V+ t- r# t模型的评价与比较
, R# l$ P$ i# X8 u0 L2 ~ 第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。* W3 D% a: r- _* K6 C( K0 x2 k
第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。9 w5 [ x5 n9 e* a. j
第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。0 j# j& w, x' I
在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。. Y, q, n# `' K* D, U& |
但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。
0 T; |7 b \6 O1 |: n# t参考文献; t- i; ^+ @( V/ g# K, R1 c2 H8 t& t
姜启源,数学建模,机械工业出版社,2005年2 Y! W- Q. l+ P ]* w" Y/ M
吴建国,数学建模案例精编,中国水利水电出版社,2005年
: _7 L0 j- Z* v( t/ X6 _% X附录) Y/ d8 J y1 r3 \. N% u
8.1 模型Ⅰ程序! _4 A* K4 H4 c% d8 d
x=1994:2009;
% u& J; u, N6 ?& wy=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];
5 D& Y, W/ C: Y* WA=polyfit(x,y,2);8 I, w5 r! U% x, H: p: A
z=polyval(A,x);5 [# T' m- |5 {
plot(x,y,'k+',x,z,'r') ;
; O6 @6 z4 t8 y' p; h" I. kA*[2013^2 2013 1]'
- x1 d0 a" G. q, Y5 rans =103.0261
9 r/ F" Q) K2 c) }# M! n. s3 O' U" ]1 ^, C* n; G- t
8.2 模型Ⅱ程序
, G$ M& i& {% q7 ?- Ut1=1991:2006;
, o2 U+ S }5 ^* k5 `3 D7 ux1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];6 L6 r, T% B1 D5 J9 |" C2 T' b: H
plot(t1,x1,'*')
) e6 C. N" G q/ t; ^a=polyfit(t1,x1,2)6 g5 C3 d C6 l+ D5 _, ]+ y
. R7 K' G( M! {( @
x1=[85.31 2.4862 125.17;
1 w E( F5 t, G8 ?$ i) C. E96.87 3.2745 119.41;4 m* ?) R3 {5 l3 j5 {
105.22 3.0211 112.21;; }' P; E# r' J# n. ~
116.95 3.2972 115.88;
' m' _# @( ^: c: t! J, |120.41 3.5714 123.8;. h* S2 e y: S8 o0 h8 d
118.61 3.4308 125.02;
) @: p2 l- z, y( S+ [115.14 3.5023 125.52; \: `' Z* Q; {" J) ?
115.3 3.6067 125.17;+ x# n, |0 v+ b W7 v
115.58 5.7878 123.3;
: G" ^" T1 U- P115.88 5.7918 125.6;
: b" w3 F+ s/ y" Y8 E116.82 5.5036 129.17;; _$ W# U6 q$ P" |) x9 H4 l# z
118.14 5.5611 132.87;
' S Q) P7 C0 a2 H/ Y u9 H122.97 5.6544 139.14;+ ~: O( Y$ t) ^4 `* {
141.95 5.6950 154.67;' J, m7 N8 K* F7 J9 ?% I5 ~3 Z$ B. c
159.91 6.2994 167.06;
1 \0 n9 k6 O9 e3 @$ H; e& _# c164.88 8.2410 169.69;
* E! V- c7 D4 h* |/ Q }8 Y167.96 12.4817 178.19;+ W6 G6 E' I0 N' |" z% x
188.59 18.3553 201.28;/ `& M/ B- n% C8 M
205.62 21.8719 222.2;
5 B9 @+ `8 \( V: S. c9 `222.82 27.3894 234.18;2 w0 T4 G4 H4 \6 ~# P
213.8 32.7452 220.94;
6 v8 F7 h* L& V6 O/ p207.29 40.0573 201.65;
* V. t# Z; G! v8 E8 ?" W196.7 44.5034 192.94;
( S- ~7 @# M5 H- }7 T" o/ R191.02 45.3479 192.32;4 }" a' Y( w4 A9 U6 ^& C
172.88 51.4176 179.71;
" `2 \7 X3 T h- A8 o158.65 50.1082 164.6;
) ]9 J4 N! k- ]];# A' x6 y& n# ]
x=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);
3 g8 @2 a- d" L/ K% z' b2 O[b,bint,r,rint,stats]=regress(y,x,0.05)
4 |& Y- P" ?) ^/ I% m+ t0 z* u/ j/ Y$ e# w6 w+ \" B Q4 c
8.3 模型Ⅲ程序
4 `" R# {- l. r6 I. \+ j2 ^/ V# mt1=1999:2009;
7 Z" ?6 u8 U( _x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];8 x8 N; O, M2 W; P# D
plot(t1,x1,'*')
3 `0 q5 I/ `2 u# c- wa=polyfit(t1,x1,1)
7 _$ }. g$ {; D; j% z& m* m
& c& \. A( J* R; I. b: Vt1=1991:2006;: Q* w, a3 k0 D3 |5 F- L, t
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];) _- _ Z- X- v% ?' m
plot(t1,x1,'*')
R$ E1 _, v% f3 ], T! Ja=polyfit(t1,x1,2)0 [& z, l% @9 G! d; _
|
zan
|