- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况, p" l7 B9 |( L, K( p
摘要3 l0 c: z' v- m/ x$ c6 l
该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。
* c% d% d5 o# W* y# H+ ~4 s' c 我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。
9 x6 ?+ M& o3 c7 b 结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。
9 w% f2 o. h2 \' t* n" P$ n3 i$ c) U 上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。6 h% r9 V* b& V
' h# X0 ^9 j' |. }" \
/ o- ~# o+ A7 ~1 ` ) z, H6 R0 {+ C9 A, r _3 [
( j5 w1 J" k/ {6 P
7 L. @& ^! Y3 @
. V% t5 R" a- ]3 V u& B8 y0 {
4 H9 b( ?& ^' }# G8 D8 e9 e 3 i7 ^( Z9 ~) o& M
3 [) K7 h! a/ B: r* F 关键词:直接预测法 间接预测 模型改进 三种模型 误差分析
$ O7 ~5 u+ Z9 t/ r2 [9 O4 U) b
1 i: [( R$ t7 \4 j6 X5 n& B $ z4 }# G6 O0 |5 w# S6 h6 _; h
, P5 l9 n3 \3 K6 t0 u& u
) u/ ?- N7 E0 d问题重述
8 T2 S. G6 M9 N- q) q | 该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。
! B; Z; s1 m# ?3 @: k问题分析
6 m7 ]1 F6 H1 y6 w p 要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。
$ A9 g3 m/ V" |/ z& F$ ~ 对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。
, G* ~/ I0 D) ~* }模型的假设0 c' {9 v0 T8 N7 w
表二所给数据为普通高中的数据。8 r- }$ x& u+ Q4 \2 }# v
高中生源情况以高中毕业生人数来估计。$ Y+ |6 w" R# e1 e7 M3 K/ P
定义及符号说明
3 g+ a% Q9 [/ d, C:模型Ⅰ的时间变量;
! m0 p3 V! Y2 ]! p4 ]: k1 ^. l:模型Ⅱ的对于高校招生人数的时间变量;- j+ q, c2 o9 y3 Y/ s: a& z
:模型Ⅱ的对于中学招生人数的时间变量;6 n% L8 M0 v3 Q
:某一年高校招生人数;* |& t% I# _) D, F" d q
:某一年中学招生人数;* {) ~: r4 |6 C0 U* I9 q$ X( h2 B( X
:某一年的中学毕业人数。$ Y$ z* {+ |3 j, @% H
模型的建立及求解, _# E- i$ d4 n6 ]$ O* z
5.1 模型Ⅰ的建立及求解
; h( z+ V- M. s7 R% ^* t @, ~1 I 由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。
9 x4 T# ?7 ^ d5 |5.1.1 模型Ⅰ的建立& \5 r$ P9 [3 y7 E: K/ o
提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:
) U Q* @% G) M4 i (图1)8 ?, c* h: c1 s H9 R0 d, G
由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
2 W8 N E) }8 s5 a 因此我们根据1994-2009的数据作图有:
* H( X- m' ?/ Y; j! {* n/ h (图2)3 I9 O9 x4 k! B$ B$ X+ M
对该数据进行二次多项式拟合:" e$ {$ g2 T# r' ^$ [
(图3)# n8 F. ? R3 [, S7 P$ }
5.1.2 模型Ⅰ的求解. @( n, | k; I" x
拟合所得函数为:
- C' i) X" H! s, E+ { ;. I( P8 v# h1 C$ M9 l" j- @, [
带入,得到:。& n0 A( J8 G1 e% D& d" R0 q+ k
5.2 模型Ⅱ的建立及求解
4 c* v- q6 {0 P# ]! O& C 由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。
% {7 w9 ]0 C/ K5.2.1 模型Ⅱ的建立; G6 J6 x2 Q% U
提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:& o8 A ~: {7 W7 j( b5 F
某年份的中学招生人数如下图所示:1 i _! d" p/ `! g6 {! E" K
(图4)3 V; d- q. P8 T- E; n
建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:# p& Y$ f1 C! l" s
(图5)
; ^6 K/ K/ `0 _, H. [模型Ⅱ的求解
0 i- ]2 h! K5 t( W8 q3 G( C对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。
8 L: k3 G% J1 v. t2 R对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;+ N+ C' K1 x% Y0 h' w& U; t/ A
将带入上式,得到:。5 ^; d. B4 O+ g+ l* u0 [( r
5.3 模型Ⅲ的建立及求解" |1 X. v( G- O% v& L8 ^4 z
由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。
# F4 o) j7 a1 z- ~5.3.1 模型Ⅲ的建立! M+ W* m4 [# I( W7 J" a# d
首先对给出各年份的高校招生人数趋势:* Q8 `9 p. Y( w4 I& c& `. g- i7 F" x
(图6)) E7 A5 G4 B. N* R% X' D1 D m
某年份的中学招生人数如下图所示:
+ [2 P2 l6 L: p" ^# N(图4)9 H: |8 Z5 w1 f! C
如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。/ B5 V' l# N5 o
通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。
: U9 g1 j( p6 U! }" S5.3.2 模型Ⅲ的求解
) n( |/ f# p* w" g1 M9 P# y对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,. U. i6 t5 j# C* m
将带入得,,即为2013年高校招生人数估计。
6 \4 z4 f9 Z) X1 t0 u对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,
! {6 p* o( \0 v6 u- i+ R' j 将带入,得到,即3年前的中学招生人数估计。
! x* g: _! I2 u- I! T+ A5 K8 x利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,' R( s1 `( p& Y9 U+ \" y5 x
将,带入得。
2 M* o. {. V" E模型的评价与比较
0 Q2 ~" _$ q: } P2 v6 x$ c ` 第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。
0 b0 ~' E6 `% } T4 \ 第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。" h. ?6 W3 ?8 T8 u! I( O. j3 ~2 W
第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。, G) b" J& X* ]( z$ k/ p
在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。
! b' w7 |' @) x" Q 但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。% O# C# l+ L t$ F
参考文献( i' H' V' H" ]$ Q* p s: b+ @
姜启源,数学建模,机械工业出版社,2005年
; \: f6 d: T. V9 l, G% ^* Q2 q吴建国,数学建模案例精编,中国水利水电出版社,2005年' x; ^3 X8 \( Q! m
附录
# v( G' z( d, r$ W8.1 模型Ⅰ程序
0 N/ e7 \$ `8 b. ~; Nx=1994:2009;
1 O4 A+ V: A6 |# ?( Ny=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];7 Y3 _% ?. |% f. L% R$ T% E
A=polyfit(x,y,2);
6 Z- E2 E0 H$ F' p0 _z=polyval(A,x);: N! u$ @: d) L
plot(x,y,'k+',x,z,'r') ;0 J4 S* V6 @* o o Q: ?) Y E# T) W
A*[2013^2 2013 1]'
2 a$ c8 @8 A9 K6 U$ W) K) bans =103.0261/ ]1 L/ i# s; q# e1 d9 M* W
6 [, o) x6 z+ V# q4 {. B8.2 模型Ⅱ程序, B4 s$ h5 j# {
t1=1991:2006;
8 m) a g8 C& n" h5 q, u" l- Wx1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];* ]$ Y# o0 b6 A: ?# Y9 B% {: d( ?
plot(t1,x1,'*')! _# e; `( U3 L7 m3 c2 X
a=polyfit(t1,x1,2)
+ B, [% H h" l9 J4 {# H* c+ u
. k/ f& Y) E6 n- `x1=[85.31 2.4862 125.17;+ |$ K5 h) t' Q9 M* L& p! Q6 Q2 L
96.87 3.2745 119.41; S2 {* u) N/ O
105.22 3.0211 112.21;
- Z& ~5 |7 b# E, D116.95 3.2972 115.88;" o% P; j& y* }9 `$ k. E( u4 k
120.41 3.5714 123.8;2 j3 K( z' Y5 i( K: i
118.61 3.4308 125.02;$ w/ Q/ A8 [1 g* Y& a3 f+ B/ J
115.14 3.5023 125.52;* K: J/ @$ K+ q; G# I# g% o1 q
115.3 3.6067 125.17;4 J9 x* u; S0 i4 E' T- H; b
115.58 5.7878 123.3;4 e; K0 M* |! x1 t
115.88 5.7918 125.6;; E; ]% _. o+ n. o) V3 k* @
116.82 5.5036 129.17;
" {% }4 ?+ ]5 p) ^4 G118.14 5.5611 132.87;
0 k: n5 ^+ U& g! N1 g1 R3 V. z122.97 5.6544 139.14;; X7 \- c$ Q8 j# x# w/ G
141.95 5.6950 154.67;
' Z) e/ K/ ~/ O# n7 _159.91 6.2994 167.06;
9 t; H- w# a: g" g4 ~( Z164.88 8.2410 169.69;
0 @% v& E g- P, ^" A9 F( n5 v167.96 12.4817 178.19;
' x X3 }' c. ^188.59 18.3553 201.28;
p r+ Z9 A* v205.62 21.8719 222.2;
; I0 Y( k; f8 |$ V: C222.82 27.3894 234.18;) n0 t2 H$ z. M+ S/ h
213.8 32.7452 220.94;; d( x6 A' l# `$ q2 a" I" l
207.29 40.0573 201.65;
; h4 P* }3 J) @ x3 p- ]& h4 V196.7 44.5034 192.94;% [3 x% N. k6 ?$ p- Y- b& K
191.02 45.3479 192.32;
& P) d _. T4 J+ v( a: F: }2 H172.88 51.4176 179.71;+ s( d$ I9 y! ~! j
158.65 50.1082 164.6;
; a6 m$ Y6 [1 L' |6 H];8 K8 |$ w6 t. W- Y) R% r7 T
x=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);( s* [' j# g9 N; D: c
[b,bint,r,rint,stats]=regress(y,x,0.05)2 @- q$ V; \- |3 D# |7 f: s5 d9 y
3 B: K1 h9 u: O: S# f1 W
8.3 模型Ⅲ程序
% @' Y3 D& Q. m3 J& wt1=1999:2009;$ t8 |$ Q" N- [! m
x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];
( b7 O1 i* ~ q: X' Fplot(t1,x1,'*')9 z8 j8 w: Z) c
a=polyfit(t1,x1,1)
8 K5 U2 W+ F" V6 k
& R& V' E& D7 W. o$ Gt1=1991:2006;
0 @0 k* z( |$ h2 J* \x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];- H2 _7 s. S! x2 \. T1 p
plot(t1,x1,'*')
- k. o* a! U9 _; k' W& j8 Ba=polyfit(t1,x1,2)
* T d R; H$ D( f7 _( [# v |
zan
|