- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况8 H+ p6 H: b. g9 O
摘要% [3 B+ Q! k+ G4 w5 B
该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。$ y4 G3 X! q5 l( j
我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。
' G# l+ D; v1 f2 U 结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。2 Q* g+ F$ f" s$ e! A
上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。* K+ d* {. S$ N( A' @4 D
& {* o% I' ^( l3 j& {5 ` 6 A1 i% j3 R# b5 \% B* j
$ L3 U% y- N' _7 E8 K1 m
- S: Z' `+ a# _$ N( L' Q
0 T+ @- x: H+ N
, _" V. E9 r x+ o4 ?- N* F b$ h: I( W0 L: n
+ w$ M, p+ @2 D
0 G/ p3 C4 R9 O# Z& _ 关键词:直接预测法 间接预测 模型改进 三种模型 误差分析9 r0 P' F. O0 R1 s8 [# y) ?. M
2 \5 @) O. K z: f
1 H& j- U" \5 k; Y2 j
4 ?2 `) a$ Q8 Q" l6 g* b' W) y* Y- {1 Y& _$ E% p$ t
问题重述( w% q/ J! P. g
该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。
& u# b7 C! |: h问题分析* A& p1 r/ ]+ A7 M/ E. R
要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。7 ]; I7 P& T- c( P0 ]" E
对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。0 F$ G% L3 G, z* T. ]" A
模型的假设# y) V( r! Y) L
表二所给数据为普通高中的数据。0 @8 K# `8 B5 w# _0 \+ M2 E; G$ Y
高中生源情况以高中毕业生人数来估计。6 ~3 W3 }; R' P( x' A; z' ?! `7 N
定义及符号说明
8 h: M- l" T4 e:模型Ⅰ的时间变量;
$ l1 l+ B1 ^, U% ~' o" c:模型Ⅱ的对于高校招生人数的时间变量;% K4 G) c6 j6 m
:模型Ⅱ的对于中学招生人数的时间变量;
$ [ { K, h" Y9 d6 F:某一年高校招生人数;
! T+ {6 L! R# n/ u5 j3 E' [:某一年中学招生人数;" t/ _7 D/ i+ m# z* z
:某一年的中学毕业人数。
( Y9 J, O6 [8 t* h, A& U模型的建立及求解3 R1 A5 g3 [* v) R" x8 x
5.1 模型Ⅰ的建立及求解
+ g3 Z6 A2 H# e4 a 由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。; q/ a# v0 r4 k0 k* U7 c/ \
5.1.1 模型Ⅰ的建立
' x1 `3 j! ^& @6 F ?1 z 提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:" d, _( _8 P( F4 N( [
(图1)6 @6 ^3 d$ H4 E* G; D
由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
& Z- E) H s4 A- w 因此我们根据1994-2009的数据作图有:
6 T% L: c4 c9 |( e x (图2)
% T" F4 b- X( \$ I* j k0 [( E2 X$ I 对该数据进行二次多项式拟合:
1 ?, I5 Q# V) |$ b8 z' S1 X (图3)
7 M9 o; S) j) i" D, [' F- s5.1.2 模型Ⅰ的求解
( H; [9 A) @7 ]4 s. K. h& I9 Y 拟合所得函数为: d! e0 K2 @6 d* C: f
;3 ~' }" ]; D8 X, `* m( B/ t
带入,得到:。
( r U) y# i# H9 g5.2 模型Ⅱ的建立及求解, d' ]$ O- g) j) [
由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。
" J v! E/ A ~! c" u1 t% X P! n# P5.2.1 模型Ⅱ的建立
/ K# r! s3 w! @* y/ V提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:
3 t5 _- F4 U1 h9 V某年份的中学招生人数如下图所示:& R$ s) }' M6 V3 u9 o7 o' l; t
(图4)
# n4 A" j( d+ t5 g: Y" Z建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:
/ ~* ?& d8 e) k1 @(图5)
9 U" K% m) ~. Y% }6 v. J模型Ⅱ的求解* p( s& ^& g8 R6 t7 v, ] Y
对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。7 E; } i/ _3 E3 S3 I
对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;
2 v, G/ X F% g" ~; K, [5 A V将带入上式,得到:。+ H5 u W, S, @" J1 m, x1 p
5.3 模型Ⅲ的建立及求解3 T: j/ F3 v" R$ k' v+ o+ ?/ N2 q
由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。: N# c' v% y) R) x% c
5.3.1 模型Ⅲ的建立
# Y* ?+ I' y' O; B$ [. R$ X0 ~ 首先对给出各年份的高校招生人数趋势:( p8 ?$ _. l* H- s( K: g# x' Y
(图6)
l0 Q. W, S/ r P某年份的中学招生人数如下图所示:1 o, _) l y# x" I% F
(图4)
$ `. \/ S6 M; }3 A 如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。
c5 \5 \. i4 n% ^' D 通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。
' I$ ]4 R: E+ P" v9 j) h( m, g3 n5.3.2 模型Ⅲ的求解
# n. y. D- B" G& Q% K. q. b$ _对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,. z+ M; g: ] A2 r6 B1 k
将带入得,,即为2013年高校招生人数估计。
, \2 C& O9 P+ o0 s; o对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,8 N" X, { b9 a" Y4 v r2 Y
将带入,得到,即3年前的中学招生人数估计。
! R2 ?- @* q0 J利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,
# Q& b6 }% Y- X* W* e 将,带入得。
( H7 Q$ w. g: [' @6 |" p模型的评价与比较
; G6 z: V) }$ V( A% Z3 C" }$ q+ P 第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。
3 N$ M& g* g' H* i 第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。0 T; e+ i5 A7 g, B
第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。& _6 i4 z- ^, C+ b: t
在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。+ S' X1 y. N3 O. t4 U! K
但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。( O5 i/ [5 \9 @7 N) M' u
参考文献
- C$ i Y3 E) @& n姜启源,数学建模,机械工业出版社,2005年
* `& ]; Q4 j' y# ~- W吴建国,数学建模案例精编,中国水利水电出版社,2005年
1 H5 L& E; ?$ z+ @4 n附录% c: c- a2 D) a8 P( d2 O; b( [
8.1 模型Ⅰ程序
. B$ G4 a* O7 @! `: P0 [x=1994:2009;
- M: c$ _8 v3 ]5 \- x# I+ z% g- cy=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];
$ }* P5 I+ F2 J) K4 z4 f- j8 bA=polyfit(x,y,2);
2 u8 N! _2 q1 f4 I" uz=polyval(A,x);
5 H8 H# p, \$ H% nplot(x,y,'k+',x,z,'r') ;3 h$ c8 {( q# g$ R9 O+ B0 p
A*[2013^2 2013 1]'
# A h8 M8 \" b% }. lans =103.0261 w- z. Z* v u# V, D- |/ k1 _, ?2 e
$ e# ^6 k! Z" o9 O' I
8.2 模型Ⅱ程序0 j+ [6 \* J+ f) v- G
t1=1991:2006;
+ w0 w' K( v9 T' t9 l: V3 r- px1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
/ \( Y+ l1 u$ |* M9 L8 j$ `1 v2 Oplot(t1,x1,'*')& p ^' C+ Q X$ ~8 y) ]
a=polyfit(t1,x1,2)
) x) z0 v0 N: d4 R 2 j z* N& y5 v/ z5 O( Q) f
x1=[85.31 2.4862 125.17;: t, f+ [5 C D& c# P ]
96.87 3.2745 119.41;
/ n. s! O/ ` J; ?1 _105.22 3.0211 112.21;$ L) C5 a) L, r- M: ? T
116.95 3.2972 115.88;
' N/ a2 T \$ o3 t' n. D120.41 3.5714 123.8;
y% X( D+ P& N1 I# f118.61 3.4308 125.02;# F j0 w- I, ^% f! |# X
115.14 3.5023 125.52;
) i0 _5 d" c) m h4 o" r115.3 3.6067 125.17;
2 g3 z* Z! N/ [* }115.58 5.7878 123.3;+ [- ]& N( A m2 v5 a2 B/ ~- c
115.88 5.7918 125.6;2 r& j6 ^. y1 U
116.82 5.5036 129.17;
% |" L" E) \% y' |: a7 V- T118.14 5.5611 132.87;! q j) a, N& A0 c
122.97 5.6544 139.14;
/ d9 r& |+ t) U- x D+ K141.95 5.6950 154.67;
% F% }4 p4 F; z# m. W; M159.91 6.2994 167.06;
2 z; J& R* l& b# v7 O& @( X164.88 8.2410 169.69;8 w+ {0 B# K M7 U! t' ]4 |6 n
167.96 12.4817 178.19;) T0 L0 k1 L5 Z. r3 u3 g$ J0 n l
188.59 18.3553 201.28;8 R( P- J! i8 D1 [7 [$ H
205.62 21.8719 222.2;
7 o' u1 X4 _+ E! j/ r5 @0 b6 c1 ?222.82 27.3894 234.18;
- b5 e0 G% p g& A/ h213.8 32.7452 220.94;
9 Q, p% V$ A% ~* i; R- t207.29 40.0573 201.65;
) s5 j( }+ D% V, [5 t196.7 44.5034 192.94;
2 y' ]* d y9 g- ]# n Z! m) h* J191.02 45.3479 192.32;3 ]3 W5 W, z2 E7 n
172.88 51.4176 179.71;0 [, g+ ?1 g6 k \8 v" K1 x3 w9 e
158.65 50.1082 164.6;
- I0 [. A" N0 l];' F1 B5 o( l- C! z
x=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);$ @, s7 H# A- v+ D
[b,bint,r,rint,stats]=regress(y,x,0.05)& T# n' ^! b, m. s8 p
5 O, r @8 b, l4 A* v% Z" m
8.3 模型Ⅲ程序
6 v ^$ ^6 I* t/ ?/ L7 p( T0 }t1=1999:2009;7 E8 J6 C0 W# k9 _" D! i
x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];# Y3 y/ _4 G% b7 W6 u+ s! X4 l
plot(t1,x1,'*')6 @ r& w0 O5 _) @0 h; o' |' [
a=polyfit(t1,x1,1)& |0 J: h) f' l$ ?
& Q, `" `$ T+ L" ft1=1991:2006;
& d7 J% n! A+ Bx1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];9 u$ `( c: u# b9 g, i: b) E
plot(t1,x1,'*'). h+ M$ ^; l; a8 m
a=polyfit(t1,x1,2) X4 g/ v. j/ d4 T* i" f4 c a
|
zan
|