- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况
* h' Z' d- K4 Y8 L7 h/ A摘要# J) |# T$ l/ h; u6 c
该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。9 R2 ` ~5 f- I# S4 z+ d5 m
我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。" j' R, v4 c7 o# L9 O# {( {
结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。
& ^. Q( C4 I: ^ 上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。0 ?2 B* {8 l' P) h8 W% Y+ N( ?
7 V( a+ B* n! O: p1 E
' g+ j- I5 P. k7 S! R3 N , S0 \3 K% w$ h4 @6 ?1 _
4 y; b: B/ j0 C1 `" w , X- }7 @+ h9 L
+ F3 t7 B5 ^2 _; |
7 z+ c! S' T( h
: I: S6 e# u) Y Y
8 |3 I7 v/ q8 C% @0 M 关键词:直接预测法 间接预测 模型改进 三种模型 误差分析) i1 ]: ~0 ?: M0 ]( m C2 A* l! M
/ L& i- L% D. |
" ~# H A6 u) Z
5 t2 B: G1 l7 y( H2 v% u* Z
) G7 A: P7 J0 Y" u0 \1 q" t0 T+ R问题重述
. O2 F3 V: o& h 该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。. e5 X: L+ X" { o R/ ~0 m
问题分析/ ^6 Y$ L6 D* x2 ^4 K* ^
要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。& x5 {# k. s7 E
对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。( c1 v8 b( q0 `, p" d% z" o( c: O
模型的假设
7 A+ W" I, E4 {" w; `2 G. N" {5 H表二所给数据为普通高中的数据。5 O5 L" b- {2 p' C
高中生源情况以高中毕业生人数来估计。
. A- s( E: o G$ |定义及符号说明
$ i+ \; ]$ r0 W% G5 e:模型Ⅰ的时间变量;" ~: ]% k5 {' O$ K2 ]( J, W
:模型Ⅱ的对于高校招生人数的时间变量;% ^7 q! P5 ?/ X- q! @3 k! |, A
:模型Ⅱ的对于中学招生人数的时间变量;6 Y5 ~" A# ^) W$ f+ d
:某一年高校招生人数;
8 h6 U) I- H) J) y! |* j:某一年中学招生人数;0 y' ]1 s& k( u" F( T
:某一年的中学毕业人数。4 A" j, l- Q, Y9 B3 U
模型的建立及求解
7 q7 y' `( W1 ]5.1 模型Ⅰ的建立及求解+ C1 ]' Q0 D' z& R9 e. h* M m
由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。
% r9 b# O+ h4 T! | e5 W( K" d! f5.1.1 模型Ⅰ的建立) Y; ]8 d" @0 r
提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:
& ], s+ s" I8 y3 h" A$ H: k (图1)
. Y h; z9 e5 d- v 由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
* D% b5 Z5 j. O+ `( p9 w 因此我们根据1994-2009的数据作图有:+ n% M: }3 n4 s( Q6 n
(图2)
0 C1 R6 w/ y$ o' p0 N 对该数据进行二次多项式拟合:8 W f7 x: }3 |, I
(图3)7 h, z" X3 f; f0 p& Q, \, a9 s# d
5.1.2 模型Ⅰ的求解
9 S5 S H! i1 S& a5 } 拟合所得函数为:: M3 q) U2 F, ?5 s6 @! k
;
3 j( h/ g) e0 r& z7 m% |' ]0 K 带入,得到:。" ?$ w3 @+ E y7 ?8 O
5.2 模型Ⅱ的建立及求解
1 R0 y9 ~7 g( C 由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。$ f0 q! `; E3 e% M# R. j7 p
5.2.1 模型Ⅱ的建立
7 _0 Z9 |: K" i% j3 y, i提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:2 c( R8 |( L/ x5 w
某年份的中学招生人数如下图所示:
) j; S( I q6 P4 B* H _(图4)
4 Z) ^% v* c' n1 i# C. @建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:8 S$ Q9 n0 [0 p$ l1 f) L o
(图5)
8 u: N: G% W% _! v模型Ⅱ的求解
$ s+ p4 T, x& {5 V8 c对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。) P& s! ~ A' K. ]! H) Q- J
对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;. y) I4 N# n. ]6 v2 {+ B
将带入上式,得到:。8 w; Z: Q6 ]! `8 Y( f) V$ w2 Z; P
5.3 模型Ⅲ的建立及求解# u3 @: ^# m- h4 c3 A* n- Y; J
由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。
0 |" d# L, s+ Z& X1 \3 e z; z5.3.1 模型Ⅲ的建立, ^6 g( V: |% F8 b2 `
首先对给出各年份的高校招生人数趋势:
3 e/ e6 P$ j% {) W+ x* l& l# c(图6)
( h5 A3 G+ I% K某年份的中学招生人数如下图所示:0 y+ ]& ^- E: Q/ {/ i7 u: V: ^
(图4), r. t# r6 f, e% I, t9 k% c \1 z
如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。
: }- | s) ] h* @3 I 通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。2 {* G K! h+ u s- E
5.3.2 模型Ⅲ的求解
& h& P( D( |3 d5 M5 Q- [对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,2 V( B b* J0 ]& l) q5 h
将带入得,,即为2013年高校招生人数估计。
4 ?& l! e+ B7 l/ [对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,8 o6 P- c2 _0 h; G
将带入,得到,即3年前的中学招生人数估计。/ o5 x M: u4 a3 q: h% n( D
利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,% S! K1 l( S: K( W9 }0 W5 O
将,带入得。
s, i( ^5 a' n" F% { r, L- C模型的评价与比较
. r$ o7 \6 `% _% i5 H! [$ O 第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。
' t" L- Z1 n, O; \# V 第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。
3 Q; d% \' V" S 第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。
% h" X+ f. Z6 _9 f) p! B4 F 在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。" u' ~; p6 |1 x
但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。& e2 [; u$ D* I( O) R) A! N, m6 Y
参考文献7 ?4 p! @. d5 T- R1 U4 K2 H5 i
姜启源,数学建模,机械工业出版社,2005年9 G) R7 _% x/ h! p/ p$ v7 k
吴建国,数学建模案例精编,中国水利水电出版社,2005年+ \+ F# z/ p: E" s3 l, m( s
附录: A/ A, q+ ~9 F0 w% W, y
8.1 模型Ⅰ程序, j, L! T& Z! Z- _) K
x=1994:2009;; d7 n9 [, g1 s9 L1 ?
y=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];( D; `/ ]3 I. S7 t- p) O1 @7 {9 X
A=polyfit(x,y,2);" p' c2 v$ U0 S7 D7 T, v
z=polyval(A,x);
' W* y+ h# o. Nplot(x,y,'k+',x,z,'r') ;' I9 B; Q) Y* u9 _ R/ U
A*[2013^2 2013 1]'3 v' O" Y, \( d
ans =103.02611 [1 E, u, I2 X- L
9 Q( X- E1 p. {. W& J5 U8.2 模型Ⅱ程序2 J$ i; q; p+ q1 R+ _0 y6 N# G
t1=1991:2006;3 }" t/ w3 r* h
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];& i: V& U" f+ r7 g4 _
plot(t1,x1,'*')
% ^6 P* z w: V6 o3 ^a=polyfit(t1,x1,2)- Q+ M7 ]- y( [+ m6 `7 E
4 V9 `! [9 d5 j) A: G1 d
x1=[85.31 2.4862 125.17;6 d/ h) G/ S& n' b
96.87 3.2745 119.41;
- `" Q3 D' ?6 j7 q! ?0 ?4 J& j105.22 3.0211 112.21;1 f5 o- V! x- e& G, K% A$ A
116.95 3.2972 115.88;
& g9 K, j0 P$ _- o8 J; |120.41 3.5714 123.8;2 R! |1 d+ \" T9 V1 u
118.61 3.4308 125.02;: k* U! _# V8 i8 i. Q4 J W# B
115.14 3.5023 125.52;
: C8 Y; l1 `) Y- @* E7 J$ R115.3 3.6067 125.17;# |7 g. R2 T0 t5 z' I. P
115.58 5.7878 123.3;
4 X1 @0 ~6 u! ?9 Q9 a" t/ f1 O115.88 5.7918 125.6;" i% I; ?! e. ^) H) q4 z
116.82 5.5036 129.17;
9 w* V. A c) O# F/ D& |* T118.14 5.5611 132.87;
+ g) n( V5 b0 g+ S8 c }- o2 \122.97 5.6544 139.14;: J0 R# F" z. S* \5 H
141.95 5.6950 154.67;
% n- @ T4 K; f159.91 6.2994 167.06;! r; {, ]. }# A- b; B3 n8 ^# d9 f" U
164.88 8.2410 169.69;
3 [ n' n; o* B2 W5 }4 ?4 M! h4 n167.96 12.4817 178.19;
; k2 [# \8 j# U3 j) S188.59 18.3553 201.28;
- p2 g% B, Y/ W205.62 21.8719 222.2;
z- c5 A G! ^222.82 27.3894 234.18;
4 ]2 ^3 }3 m- H( d% e4 O7 ~5 g213.8 32.7452 220.94;4 v! w- ^& `+ _
207.29 40.0573 201.65;
6 P8 {$ I; x4 f9 n/ j, x196.7 44.5034 192.94;9 I/ n+ V6 L5 ]' ?+ G
191.02 45.3479 192.32;( o [; s( w+ e, b0 K8 m8 ]
172.88 51.4176 179.71;0 F N3 S0 Y7 C p' l5 }
158.65 50.1082 164.6;
6 _( w2 c0 k+ z- F" y];
+ K6 c6 c4 T* T6 px=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);& X0 q! o$ P% {$ q) }
[b,bint,r,rint,stats]=regress(y,x,0.05)# y3 I" w/ T& p
4 F% y9 A0 Y3 [) j( L8.3 模型Ⅲ程序
# u" L" f+ W9 s( t8 t* Pt1=1999:2009;
0 X0 }# h; U2 ~, G% T& ^x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];
$ E/ L" Z" H8 n1 E, hplot(t1,x1,'*')
2 Z) H6 s. v+ U8 ba=polyfit(t1,x1,1)
1 C$ [ g! I7 q$ u3 r) C
M0 n$ k" s* ~' Vt1=1991:2006;5 c& v* h: r& c* `( L# n3 [
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];' [' R3 L. s. Y, u; E
plot(t1,x1,'*')
/ \6 l6 `- ~3 x! ba=polyfit(t1,x1,2)
3 r% N+ i2 Q; C# t% z& k. Y |
zan
|