- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况
1 E3 h3 A0 s5 C4 i1 N9 D% ~0 o摘要2 e! z6 p/ e3 A
该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。8 K2 S" O0 A* E6 H$ ?8 [
我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。 s5 T; R/ ^% M- v( v" U$ ?# R! ~, C
结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。
) r$ a; ]4 r" B* i2 Q& p, q 上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。
% t- j- c+ @9 k4 z m 6 G, W/ z8 T8 K+ t+ }
% U) u% s( l2 Q% F! p8 f
5 J3 Y2 g- j% P- r, E% G5 @$ J# N
5 L, @5 P V; l7 I) Z5 r+ Q! @
2 [7 V: s9 A6 q0 b2 `5 O ! c0 @; Z/ n: J0 N; T, W, N$ C2 i
& w2 ~0 X$ d1 a% O! I' X: U% O
, p: j* |; I9 E3 F0 K" L
4 x3 Q" A; y- U0 C, c, I 关键词:直接预测法 间接预测 模型改进 三种模型 误差分析
5 j n8 k3 k# [2 a$ i! I , n" z9 s8 M0 N, ^* g% } M: U
" ]; }/ g% m9 F- C& Q
; \8 m" m" a+ t& f+ {
# E$ J F. F& u- L
问题重述) B, v/ N# W& ?; _& A1 L/ r3 i
该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。
# h+ _, G7 g7 S问题分析
/ Y' T m8 k0 {, g/ k, r e 要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。
" l3 ~( X1 s7 G$ U( h 对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。
, w4 O8 U5 ?) u- Z, k! E& N; J+ X模型的假设; `4 n' t/ {! \- p7 A. _' u# p& ?
表二所给数据为普通高中的数据。
% q; n! a3 ~+ ~4 ^高中生源情况以高中毕业生人数来估计。8 C6 E1 ]0 q; d5 Q/ i1 x$ w5 f4 T( y
定义及符号说明$ M' ?1 `" p. R W
:模型Ⅰ的时间变量;. N9 ]; a/ B; e% B6 n$ p& ^; F
:模型Ⅱ的对于高校招生人数的时间变量;
6 o# K( c+ I' l4 `" @( Q& N- z:模型Ⅱ的对于中学招生人数的时间变量;; ^4 ? k0 X7 G
:某一年高校招生人数;: a( D; F) B. D. h
:某一年中学招生人数;* S: B# w" j/ j
:某一年的中学毕业人数。- C, J% f e+ U8 s) N5 `6 z
模型的建立及求解
+ r( ?9 \8 _, J! u5.1 模型Ⅰ的建立及求解, x; f/ K5 h5 ~# u$ N
由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。# q& K# K% a' O& Y! `
5.1.1 模型Ⅰ的建立
" K) B/ b7 j* e X8 ] 提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:
$ g4 u# s# Y+ n% l, \. b (图1)
6 u+ |7 O2 |1 U 由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
& r" h4 Y5 r( Y, `5 R1 V+ C 因此我们根据1994-2009的数据作图有:! V! X6 r9 Q3 X1 |
(图2)
( W( C; X& q* s" H 对该数据进行二次多项式拟合:& k5 N1 u0 i+ `9 I4 S k
(图3). K' u) ^. _( q9 u- v9 _
5.1.2 模型Ⅰ的求解
2 V% O! t3 n) q' w 拟合所得函数为:% O, @5 C! [/ m0 I0 r
;
" v' l0 M. B2 t( J+ y6 n# \( l( }9 n. e 带入,得到:。' Y' N; a, M! l$ c
5.2 模型Ⅱ的建立及求解
' s; \! T) w& L& J* Q2 \0 ? 由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。. E' P3 q) \3 c" d3 l2 l+ l% B; L4 c
5.2.1 模型Ⅱ的建立
! a: k" b+ G! M9 r- J+ P提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:
6 S/ u2 {, f8 R3 p0 h/ g某年份的中学招生人数如下图所示:# R3 ^) e6 k- r/ T& U
(图4)0 S& H4 B, @. _
建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:
( a' C) c/ O/ k2 s(图5)# K* X; u) n9 N0 w9 T
模型Ⅱ的求解
4 c5 L/ h4 e4 E对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。
) N# E2 l5 k! q& d9 ]* W2 [对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;
$ i; p0 v- w5 v% Y, V7 F将带入上式,得到:。
* J9 ?3 U1 B# }1 M% H& `1 i5.3 模型Ⅲ的建立及求解
' y/ |7 {% g$ j( I$ ]" T" { 由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。1 o; f; p9 z% `: h* @/ n+ H* L; u
5.3.1 模型Ⅲ的建立- u0 M% A( h% Z/ h5 a. T9 D
首先对给出各年份的高校招生人数趋势:
- C Q4 @, r- A/ K(图6)
5 K% R. ^9 t* L3 K某年份的中学招生人数如下图所示:
8 U! x4 D u$ j' z% s9 W& w(图4)1 O, J% S0 D3 p* c; h; i3 O5 j' y0 W
如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。
o8 m7 c! l# ]7 ~+ [' K1 g" R 通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。" C* v" K) B+ i7 k- y4 q
5.3.2 模型Ⅲ的求解
7 q6 ?, J6 \# D1 Z: o' [对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,& c% ~6 K. g" |3 c5 D; E
将带入得,,即为2013年高校招生人数估计。
& u/ v7 G z0 v) d对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,
8 b _/ N# ?5 ~5 B 将带入,得到,即3年前的中学招生人数估计。
& W) X0 I8 d# l& D利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,
( j+ ?" q1 r1 w" K7 u" G 将,带入得。+ p0 R* G' u+ {+ S
模型的评价与比较9 A0 z+ S0 G+ C4 w
第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。
3 J* n! I2 C; E 第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。
0 O0 Z) r4 v( t* h4 q 第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。6 k* T) C- _3 _' r7 D
在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。
% s8 P! |. H; r3 f4 h2 T 但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。
4 H) d( F. C1 _" c4 m参考文献
" d+ \2 }& C/ M. c& z姜启源,数学建模,机械工业出版社,2005年3 B0 e) l1 m: ?
吴建国,数学建模案例精编,中国水利水电出版社,2005年
k# \4 L, L) V f6 c# ~附录
4 i. @- e& g# @: X+ \7 ?7 B7 D8.1 模型Ⅰ程序& d4 x$ T( \" K! e$ r; o& }
x=1994:2009;
! c" ?( |* _' a8 ]3 \ Gy=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];4 ?* U$ X2 B$ H
A=polyfit(x,y,2);# z" ?5 j- c( d) W
z=polyval(A,x);8 _" Q. m- n+ r' P
plot(x,y,'k+',x,z,'r') ;4 s* `1 |7 ]3 U$ _" i
A*[2013^2 2013 1]'
9 S6 L( Y3 F# v8 K# `8 bans =103.0261
7 f4 \" ` q8 ^; e2 E& i) U: @2 _2 n8 _+ d
8.2 模型Ⅱ程序- D2 p- n$ Z3 B/ f3 }& f/ @9 N/ n+ X
t1=1991:2006;& [# Y- z! N& m7 _$ y1 X
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
7 Q/ o( d) k9 r' v& m Dplot(t1,x1,'*')' P+ o1 z& q3 _; H" V/ c L3 ?) l
a=polyfit(t1,x1,2)
0 A, N* G5 \! X" J" K
% x1 F1 [* }3 Hx1=[85.31 2.4862 125.17;' i2 H2 A- } r# ?' ~4 }
96.87 3.2745 119.41;
+ y' T0 w4 x) V1 O$ i' w* r105.22 3.0211 112.21;9 T# v/ I5 F& A( d0 ]
116.95 3.2972 115.88;
9 V e; s7 G% {1 y; _120.41 3.5714 123.8;4 J2 ]$ s. [% B& T
118.61 3.4308 125.02;
' a! Y6 [+ G! |# R4 V( c$ f6 o115.14 3.5023 125.52;- Z0 y9 s0 u. q* Z6 t" p! T0 y+ I
115.3 3.6067 125.17;1 ^! |6 i# [* K3 T
115.58 5.7878 123.3;
+ G" C! V; ^ j9 c3 l: n- K9 Q115.88 5.7918 125.6; S' V' y5 b9 r
116.82 5.5036 129.17;/ K3 c% }) {3 B7 `& E) |' L
118.14 5.5611 132.87;
+ J6 ]/ R: v" N! n0 X$ ~) a6 c122.97 5.6544 139.14;
$ {+ y W) E5 m4 @ t141.95 5.6950 154.67;+ A* J5 p9 }9 H2 }1 e
159.91 6.2994 167.06;3 j0 w& q2 ~( ]$ ~) o) N
164.88 8.2410 169.69;
' x0 z+ m9 d, n. ]( x3 [167.96 12.4817 178.19;9 u7 \+ y+ O" ?9 t9 ]& c: W
188.59 18.3553 201.28;: w! U6 a: ^1 ]$ |
205.62 21.8719 222.2;
2 [6 z2 T1 [6 a1 ^" A+ q8 i b+ N" E222.82 27.3894 234.18;
* O9 s- v6 M: p4 Z213.8 32.7452 220.94;2 M* ?9 u2 u; j& T# z7 B
207.29 40.0573 201.65;% a% \$ U$ N: o1 P; |. K8 a
196.7 44.5034 192.94;( q" H' t2 u8 p0 w! u% @
191.02 45.3479 192.32;
N1 {0 D- u n# z8 h172.88 51.4176 179.71;
& B: v2 ~0 v0 D+ U* r& A" z158.65 50.1082 164.6;8 d) {' V$ W) w0 E3 p
];
% ]: W" c' g/ j, o0 i, cx=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);, L5 [$ z! N$ k- j3 Y! y2 q: Y" M
[b,bint,r,rint,stats]=regress(y,x,0.05)
& ?1 x; p; Y, o5 L/ z6 c+ f2 C2 g/ W( s% T# x
8.3 模型Ⅲ程序
* H! p i5 w6 |% {' i& u4 S5 C5 Et1=1999:2009;' c4 m7 C! b8 f' I9 _8 {& k
x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];% W* \ F$ t/ x4 U# X; U7 U+ \
plot(t1,x1,'*'). {* o& E9 S7 v/ j, X ^
a=polyfit(t1,x1,1)
K% A( K1 [1 L+ u3 [2 }8 T. t' u
* x- M2 C/ I9 H/ W' Jt1=1991:2006;. P# \* r6 k/ B+ t0 H( M* {
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
1 q( I F1 s3 [) ~; mplot(t1,x1,'*')
. R- R! e& w# _( ea=polyfit(t1,x1,2)' ?. s4 A% c2 P% v& S- @
|
zan
|