- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
|---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况
! ^8 X+ J7 _! g4 l1 F摘要
8 w5 x: n. b" k0 R* V: X5 v 该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。 g- Y3 n" ?/ s5 A" ]" U1 s0 Y3 r
我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。
, Q* m; e' H, J) T+ p& h M8 ? 结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。& k! P: l6 b9 q; f' X
上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。( X) Q' }- R& t
( t& ^ l- f0 w8 _1 _: X$ X( L
8 i5 l+ g% X7 L+ Q1 W/ D* M( U
7 E4 O) T$ |* R+ o1 h ) [: Y. v: y6 ?
% x+ G8 s) |3 Y. P8 o" R8 O( k1 U : n% E- @4 T1 M }( t# v4 z; b
2 {9 ]# Y0 e! w. S" J8 V! u9 |
& C- ?8 C- U% y 0 v* m" \/ j0 N0 }9 a
关键词:直接预测法 间接预测 模型改进 三种模型 误差分析! {6 c9 E" b4 ]* L `; V
m; n* F- D5 Q2 i4 W
; {$ F, C! x3 L
; {0 O e) F0 x
2 V7 e$ a! V+ i" Y8 U& k% ?; G问题重述
" t* p8 h1 g- D7 {( N 该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。1 s0 x$ y9 \1 C" n
问题分析: b9 Z8 K) n8 s O+ \3 [' |
要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。
/ b4 a3 e2 E2 m! J0 e8 t 对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。
7 p3 s( o ^2 g7 m" V$ u+ l* W模型的假设4 r) x; `2 p4 O" V8 {8 x
表二所给数据为普通高中的数据。
% R3 ]" t, J. g% A: q! C, b! n高中生源情况以高中毕业生人数来估计。
1 V6 Z6 J$ D% M6 S- }* j$ d5 S5 j' `7 F定义及符号说明
" U- N) u) }0 e5 ], L7 x0 [3 A:模型Ⅰ的时间变量;
0 b4 P0 F$ F- j& S9 t$ s:模型Ⅱ的对于高校招生人数的时间变量;! Y j3 z9 p0 c( v" T, x
:模型Ⅱ的对于中学招生人数的时间变量;
0 X' ?) s1 N" W8 o: |$ ~3 ~& a, E7 T:某一年高校招生人数;
{6 m. L) k: m, s% |0 B:某一年中学招生人数;! a. }* a! d& y) S+ {" T- o# n2 ]
:某一年的中学毕业人数。
8 S1 i" u6 s% U9 @8 ~ J模型的建立及求解: }# ]" v; \( L! a
5.1 模型Ⅰ的建立及求解; _6 k' Y4 {1 E% p
由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。. B9 `# e/ b7 ?$ e3 u
5.1.1 模型Ⅰ的建立: B; ~6 C& T% p, j; @7 _3 `
提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:/ ?$ g1 [+ `) b0 v3 a
(图1)+ s* N. }- d5 H( }) P
由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
+ M* V ?) p: j/ g2 Z- r 因此我们根据1994-2009的数据作图有:
8 h: c" G' b: d7 E, y (图2). D5 [) ~& S0 H' _0 _- W9 t
对该数据进行二次多项式拟合:+ v% k# z7 H$ k
(图3)
4 u0 G6 b- Q6 \0 n' l, ]& W5.1.2 模型Ⅰ的求解
6 V8 q' M3 [# C6 w, s 拟合所得函数为:
5 _4 }/ a( K0 T7 a- p& R$ M ;2 J$ O: z i- S9 O! e* I
带入,得到:。- C- O% _1 N, q5 Q! F
5.2 模型Ⅱ的建立及求解# \% r3 h7 O7 @4 r, t! I
由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。- N+ F8 b3 w' r! |+ X- D% v
5.2.1 模型Ⅱ的建立; F' c& ?" f; J; m) g9 o! D# [" p# v' g
提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:/ V8 O% g$ n5 z6 K
某年份的中学招生人数如下图所示:' m7 ?/ b! F& r' [) ~5 I8 _
(图4)2 ]6 P" @+ L4 r3 p
建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:& N7 u: H# o3 |
(图5)/ {% @ O5 t* t W. u2 p
模型Ⅱ的求解9 t, K/ p8 D* M- y1 |
对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。
$ ~% k; `' m$ q* }对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;
! @; u, K x4 k9 q1 l8 }将带入上式,得到:。
) A |0 v; b( Y, i1 H6 k5.3 模型Ⅲ的建立及求解
, y, r k; l- X- \7 ` 由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。
$ {# P& D# V# R5.3.1 模型Ⅲ的建立: ^8 }9 y9 G% M8 U1 a3 U8 a# i' D
首先对给出各年份的高校招生人数趋势:
- |) Q6 f& b5 L* H- n(图6)6 G0 O. e: H% j$ i7 T
某年份的中学招生人数如下图所示:
' R" [- v L+ C1 \(图4)
( o2 f8 Y" e0 \- K, n* t 如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。6 ], R$ Y& \) w; R F
通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。
4 |5 A- h$ s# p7 p7 \5.3.2 模型Ⅲ的求解
8 z0 a% D+ N3 Y1 H$ y对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,
: _, a2 w2 d& a) ^ 将带入得,,即为2013年高校招生人数估计。3 C% {) w$ j* \. z% ` k! l
对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,
- n* f. M; a" k7 m 将带入,得到,即3年前的中学招生人数估计。1 j7 X' F% f: L" c1 a3 d3 O
利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,1 h& Y3 F- S5 Z
将,带入得。
3 O6 M9 m& q6 y, |. E模型的评价与比较7 Q% U, d+ U _9 G3 {5 Q6 {
第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。2 y# |& Q3 u7 }) R
第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。( z3 j$ I' a6 b
第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。
, [' X# M1 e- L+ [+ r& ] 在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。
8 N+ A* K8 `/ U# H0 I" u 但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。& a, \! n t, J& B$ {2 a, D
参考文献6 c* z: t) F+ ^ f8 v
姜启源,数学建模,机械工业出版社,2005年7 F6 Y' f2 z) m7 h4 \
吴建国,数学建模案例精编,中国水利水电出版社,2005年
5 M3 N& ~" c0 X/ K# M% u6 f- K, u附录7 r! r7 e7 u* k& s4 E* k7 k# e6 l
8.1 模型Ⅰ程序
- L+ ~) O+ K8 q5 N) Px=1994:2009;, Y7 t0 M0 z* K. E; H; o0 n: j- w
y=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];
" }9 v5 D/ o' eA=polyfit(x,y,2);
* @) M E9 }. gz=polyval(A,x);
' y' r& Z5 f: @plot(x,y,'k+',x,z,'r') ;
8 N5 V6 m0 L2 t9 Q, o0 h" PA*[2013^2 2013 1]'
9 |6 B( l3 q/ Y' ?ans =103.0261
+ f7 n. {3 l1 D- x2 I# B9 u* ^- u* t
8.2 模型Ⅱ程序1 G/ ]2 v( m F& u3 {
t1=1991:2006;$ v2 a0 _ j, e: a
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];- L1 [+ y. O0 R& `/ G- U* |
plot(t1,x1,'*')
1 Y8 F& e' l$ Y+ c, ?) ?! Ja=polyfit(t1,x1,2) V5 R2 d+ E7 q# Z/ ^1 \0 L9 m0 `
$ k4 N$ z3 X; g* N. }9 [x1=[85.31 2.4862 125.17;6 ]. ]2 w. p! I) i) J: a, o
96.87 3.2745 119.41;
; L3 h7 ~) [5 t2 Q+ }1 M. m0 G105.22 3.0211 112.21;; N$ x. i; V. X% N' U, L0 u
116.95 3.2972 115.88;
2 n1 d" Y% o \/ C9 _/ t6 p120.41 3.5714 123.8;
4 s7 W9 ]2 q2 q8 E118.61 3.4308 125.02;" m# D) i- L; D
115.14 3.5023 125.52;- U( w8 h4 ?# I; L
115.3 3.6067 125.17;: E' e, q7 g" z) k2 s
115.58 5.7878 123.3;
7 [' O0 f, H$ e115.88 5.7918 125.6;7 Y/ s, v; |, A0 `! c, l2 H
116.82 5.5036 129.17;. D! o5 l6 T. ]5 w; a
118.14 5.5611 132.87;
% V+ C- J: m% ?. B B122.97 5.6544 139.14;
' @$ ?0 A6 @) U3 C9 b4 y141.95 5.6950 154.67;7 O' S) W& w( l( S
159.91 6.2994 167.06;
) V( ]$ K8 W7 Z7 D. N164.88 8.2410 169.69;
* d. ^4 ]/ u; Z5 d8 Z2 t" }167.96 12.4817 178.19;
% K# X$ E* v8 F* c! E188.59 18.3553 201.28;
k) x3 y- q- J$ D( F$ ?! Q205.62 21.8719 222.2;' F! \# L) r( r4 P) v
222.82 27.3894 234.18;1 `) {* V9 t J, s1 i1 n% B n! \# ^+ D
213.8 32.7452 220.94;
( _) P. X& r6 J' T/ r+ _: J207.29 40.0573 201.65;
5 _9 J' H! A1 n; V$ ], h196.7 44.5034 192.94;
5 h; g5 i8 L# y191.02 45.3479 192.32;! t9 k/ \& ?/ A9 M, Y) D
172.88 51.4176 179.71;
* n* W$ ]8 ]% e! ~! w1 Z& t1 N158.65 50.1082 164.6;
U5 R1 p/ v7 v$ \];
+ p* b; @# t S2 Ax=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);% x8 o. y- ~4 t. t, m/ h
[b,bint,r,rint,stats]=regress(y,x,0.05). v. q% n' m% ?) [9 t3 M
& [, I" k- X1 |, U$ e6 `5 N. r0 {8.3 模型Ⅲ程序
/ E4 F- f2 A* R y2 t4 c( ^- ht1=1999:2009;5 h& V, f0 c2 j0 ]3 N; ^; D
x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];$ q9 A: ?- p% h; M7 u% r8 e) l
plot(t1,x1,'*')/ D& g/ J3 h5 _/ T, D
a=polyfit(t1,x1,1)' k9 W4 v N* ^ q
! U4 D: L+ Y3 J1 Ft1=1991:2006;
1 ~: ^4 T5 ]0 f( s- J0 L M; U- Ux1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
" P0 t% d5 ] [7 }plot(t1,x1,'*'): `8 r0 y9 V2 E y3 V
a=polyfit(t1,x1,2)+ E! n2 C0 H4 {- ~: u
|
zan
|