- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
|---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况
9 X8 A, O' }1 x: `- u) D4 D摘要1 t7 I- d& f2 N8 o0 _# W' S
该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。4 P0 g: N. ~- g! a* f/ A4 ^
我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。2 i' p9 a+ r8 E) k
结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。" s- V, y' z C
上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。
, Y. h& c7 D* X l2 E* U % |) R% `' y/ H/ Q0 a; L2 ]! P
9 b) s! [' a" { + N5 X$ R1 v9 e( h
( l, L2 b) A. S, B3 M # F$ q( n A; ~6 ^6 w/ s' I
2 R: _6 H" r4 @- d8 b. ?& e
% p5 `+ E7 `1 P( S, p1 o, l. d x" n * ~$ U# G. K# d7 m
" y: S/ G, E- N$ D2 X& R" Z4 A% i+ f! d 关键词:直接预测法 间接预测 模型改进 三种模型 误差分析/ r4 n- W! c L& r: F5 w
. n2 S# K6 `. e/ t z
* M/ x0 G4 b. Y. a4 E
6 u6 S5 i# c4 {. }
; w7 }, O( |, o9 ~2 t$ o问题重述* Q u3 U n! X3 O
该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。; b+ L2 Z3 A1 @1 g
问题分析
: m/ H" i' h4 R/ V 要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。
o" {) Q$ X% e8 g' {. u 对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。
% Z& V3 {8 l, V6 S( N4 _模型的假设
& R a6 p9 ~) ^1 ^, U4 O表二所给数据为普通高中的数据。& Q" j1 T( _3 m* U: y5 ~( A% m
高中生源情况以高中毕业生人数来估计。+ W7 p4 B' a8 d% P
定义及符号说明
! e- o5 s2 W) B:模型Ⅰ的时间变量;
9 w5 f$ a; Z |+ W7 {:模型Ⅱ的对于高校招生人数的时间变量;
& F3 r( z* x4 e4 r1 E:模型Ⅱ的对于中学招生人数的时间变量;
* M% X1 h" o/ r4 ^- q+ ]/ p:某一年高校招生人数;1 o2 t1 v; Z. |/ a0 R
:某一年中学招生人数;
7 n( L- ^: n9 C( ]:某一年的中学毕业人数。/ Z# Q. Y, D& e! X( b
模型的建立及求解# @5 L% s. C9 |/ |$ I" J
5.1 模型Ⅰ的建立及求解* N1 {+ l6 W; p5 ]7 o% V- C
由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。* r! W# U: O) p
5.1.1 模型Ⅰ的建立" l, i' |. n& F% X3 z, k
提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:) \+ A" O$ I- `6 L( z8 L
(图1)+ J9 A R/ y) E6 z8 ^* a
由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
. n, @4 [; |: A: D) ?7 _ 因此我们根据1994-2009的数据作图有:4 h, {/ ?) _* _8 b% {0 z
(图2)
4 r( E6 ]$ o; Y5 R c 对该数据进行二次多项式拟合:4 ] A1 @- ^# G/ ^8 E3 Z% k
(图3)5 r }) B4 p1 i$ {* V% h0 r
5.1.2 模型Ⅰ的求解' E3 g$ {% y, `( p3 w' |
拟合所得函数为:
; @ D- o3 | _- \ ;
1 i1 w1 A) l) ~ 带入,得到:。
0 }) L8 k4 w5 B b9 s- ^0 \5.2 模型Ⅱ的建立及求解' Y; X& W' d4 K: O. N3 s3 r
由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。
" o5 K" ^" b% v {- ?% T* @5.2.1 模型Ⅱ的建立
( Z" T: F0 I; _提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:$ @8 |. b$ h6 L7 X% `
某年份的中学招生人数如下图所示:- D. \. A4 j! V0 U- d
(图4)
/ [2 I3 X# b5 m5 F* k: Q# Y建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:
& }1 X9 e. c1 \7 f D(图5)& v7 X& K, N2 V0 Q
模型Ⅱ的求解& D, q( Q% J" [" d) |
对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。
) B$ v" i, e! l) }( ^对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;" j% M+ p+ g% W. @
将带入上式,得到:。0 V8 S4 o( q k, [2 [8 `
5.3 模型Ⅲ的建立及求解* u1 n% k2 ^3 p: Z( e
由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。( \) ?8 y3 n' k% x- o$ A e
5.3.1 模型Ⅲ的建立
& }: {" t0 C& V4 R1 Y1 A 首先对给出各年份的高校招生人数趋势:4 w! W3 G5 H0 U
(图6)7 e! J& f: I7 L) j
某年份的中学招生人数如下图所示:7 G- \0 J, v1 r1 j! y
(图4)
4 i1 g# A9 Q# e" m" ` 如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。+ P) o* _+ {# `) Z
通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。' A; h$ w4 F0 G9 N9 }+ M* h
5.3.2 模型Ⅲ的求解& K7 m3 D2 p6 ^& U
对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,4 s* V7 A/ B. T [: R, N9 M; {: k
将带入得,,即为2013年高校招生人数估计。
' ]$ ^; {5 v" F) z. e( p对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,
( Z9 m+ g0 @+ m 将带入,得到,即3年前的中学招生人数估计。 G, D/ S v+ e C+ M- E2 {
利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,6 J$ A7 Q {$ e
将,带入得。
) o( q% Q5 u9 z3 L7 p' x2 m7 s1 N模型的评价与比较& K5 f# \2 a, r" m! ]# q7 \' A
第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。7 j. Q+ u. T& r, q- V
第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。
* s" }4 y( _( I! G 第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。' o. r8 N; z# B( w" {( B
在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。
6 K! ]: f" Z- Q+ w8 d4 ` 但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。5 r+ a3 d0 x" A; J$ q
参考文献 U. j6 U! O8 K& B( L1 p
姜启源,数学建模,机械工业出版社,2005年6 K) V( S0 |% [( h/ V3 J' }0 D
吴建国,数学建模案例精编,中国水利水电出版社,2005年
- G3 x' {! |" V* X7 e附录
_5 k' S, P& T' e$ Q8.1 模型Ⅰ程序% K' [8 Q% v G$ |7 \
x=1994:2009;
% X; c! J) M# E- a; Ly=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];
* q. Z. G. N; h* s; U/ [3 sA=polyfit(x,y,2);
r/ H) N2 O* j# T- Pz=polyval(A,x);
! h4 ?. H* ~7 H$ S$ _plot(x,y,'k+',x,z,'r') ;
) l; l3 |) I3 I9 D% Z: CA*[2013^2 2013 1]'
/ Q( I. |; J/ h* h- Z% M) a* Gans =103.0261
! ?! j! T ~0 r4 L. w5 n& g* V. F& A6 |! h: R! _: M) m
8.2 模型Ⅱ程序
- b1 f8 `7 f1 A# b5 I5 vt1=1991:2006;3 Z% \; P2 S; A6 q' i
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];( w& f6 {* Z7 R! K3 g+ Y$ [
plot(t1,x1,'*')
d* I ?2 `+ Z2 Z8 @: y) pa=polyfit(t1,x1,2)2 u: D& H( H, I% |0 \. _4 D- M
( B- k1 [- B* R2 b3 N5 y2 y
x1=[85.31 2.4862 125.17;
3 V1 e- {3 g, l# a/ s7 t96.87 3.2745 119.41;
5 Q( I8 t8 o; g% [9 b/ p! p1 j1 O105.22 3.0211 112.21;3 T; n0 Y& A0 [8 d) o
116.95 3.2972 115.88;+ m, M N( N7 D7 k( I% G1 y
120.41 3.5714 123.8;5 U1 Y& n6 }4 a/ e
118.61 3.4308 125.02;
, Y# R+ r6 X) y4 l! y9 [115.14 3.5023 125.52;
6 v y2 q4 r0 v( d8 z115.3 3.6067 125.17; S% L- J) n3 L; D1 L+ }9 G) u
115.58 5.7878 123.3;6 E: O7 c, M. [9 e' `+ C
115.88 5.7918 125.6;6 K2 t9 L1 m$ P( L! @
116.82 5.5036 129.17;
a! v& x! B1 u118.14 5.5611 132.87;4 A/ l1 g; n' W4 \% u; |
122.97 5.6544 139.14;
T/ X# P1 ~' H n9 H141.95 5.6950 154.67;
& a5 _( i- I7 \' {& M159.91 6.2994 167.06;+ \& T8 e% S% k8 b/ d. \/ c. z% v/ q2 p& {
164.88 8.2410 169.69;
7 t5 B+ D% e6 O& B6 @. x167.96 12.4817 178.19;+ v4 B5 {- I0 }, u/ ?# ^# Z5 J
188.59 18.3553 201.28;
) S! W. B2 Z& d* U205.62 21.8719 222.2;; @; g; t2 b$ e+ z9 L0 u' L
222.82 27.3894 234.18;
+ C4 ?( b3 z0 ?2 c; u213.8 32.7452 220.94;
6 `) D5 i% T& u* S) e207.29 40.0573 201.65;
. L/ v% J1 u- g' f c196.7 44.5034 192.94;0 w! ~$ }1 ^5 r* r+ ^
191.02 45.3479 192.32;# U1 K- X: s+ V& d3 W3 [
172.88 51.4176 179.71;
1 J: H( h5 u: S' x8 K3 _, C2 r3 f158.65 50.1082 164.6;1 k7 o! X" i" X- N
];
/ j: z. c5 ?+ g0 k7 Yx=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);
+ m; R4 {, C! b) z[b,bint,r,rint,stats]=regress(y,x,0.05)) d7 Q$ c4 s$ j. x; x! j0 y' j
4 p3 y3 L- \+ C7 j
8.3 模型Ⅲ程序* H5 d3 W" j: k7 }" v1 Y9 o
t1=1999:2009;
+ `% s) x3 m2 D7 ]/ x8 ox1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];
! p7 A, h' S( D2 \* W1 cplot(t1,x1,'*'): _3 n! i/ E: g" h* w
a=polyfit(t1,x1,1)
" Y6 V& H! X" Q' i; P9 O # z4 B4 l* J4 _; t% {2 f ^
t1=1991:2006;
0 M+ b, Q o: J# q2 Hx1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
* {0 Q0 {, J! H- Y$ }. mplot(t1,x1,'*')
, v0 Q7 Y; m" K3 }. Q& g4 Wa=polyfit(t1,x1,2)1 e3 V, M$ w' I* N6 D5 Z
|
zan
|