- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
|---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况% e/ ?! l; k8 \
摘要
9 }0 _, i- h2 u. T6 M2 s 该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。
. \+ ^4 q: n- i8 [/ x( M2 z 我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。
+ m# K/ k5 ~: H3 W 结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。& L3 ?" ?3 W1 {# c7 }+ n
上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。
9 D) p- q, ?4 }3 V) F4 I - k X6 V) P& R9 }7 H
7 f% t! a, f7 R* {) Q- k- s
/ V2 C& B: Y, v
1 k s8 g; q4 l, n4 ]6 D & d6 e Y5 @9 g% ]4 P7 ]+ d0 i
& b8 U, A' j5 s( d9 [
: p/ r2 j1 x7 E+ i" Z1 u
* F* Q: a3 l) m% @
" | @, Z& K# P& x: A 关键词:直接预测法 间接预测 模型改进 三种模型 误差分析
/ ]1 w5 K, i. S% o5 ^: M1 _ " W# X' S# z5 e; m* C, j8 Q4 k( O& C
9 W {3 M0 P" J1 n- F6 B* K
: ^: d/ y5 I8 j' F! Q9 i9 }: d6 ]. z! P- E4 A% g
问题重述
4 Q6 d1 R- m; |- D) z 该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。$ I f/ @0 Q7 ?: P7 w/ d' E1 _0 ]
问题分析2 Y6 w+ h- ^& O+ ~. q; P
要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。
) z) v/ Y. A; ^$ p9 e 对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。* g) u5 P. i. t. k* V) y4 Z+ G2 g; C
模型的假设
/ I' n9 W+ J* k W2 I4 L表二所给数据为普通高中的数据。
, D( J0 s4 K, B3 z/ d/ x高中生源情况以高中毕业生人数来估计。
0 O2 } a. c7 \% ]$ |$ F( h- j9 z定义及符号说明3 W9 c" {% O# B: v% \% ]2 p
:模型Ⅰ的时间变量;
, e( l2 W. \8 v$ H7 ]& ~" _:模型Ⅱ的对于高校招生人数的时间变量;4 @" @7 e& M/ G( V" X5 @4 n5 a( M+ L
:模型Ⅱ的对于中学招生人数的时间变量;
% J9 ]* M) n: c- d3 n:某一年高校招生人数;8 {/ @ B5 a' }$ Z1 r p& J! z6 j
:某一年中学招生人数;6 {! o, V( T/ Z' x4 ?, F
:某一年的中学毕业人数。+ u3 c6 ^2 {" s3 Z6 ~. E; s! m
模型的建立及求解" s Z: n6 h R
5.1 模型Ⅰ的建立及求解
1 o- ?3 }1 h8 \- C 由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。
5 V3 M; l" }" y# y/ H5.1.1 模型Ⅰ的建立
* L) M3 `1 e! x8 I( f# Q 提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:5 ~- b: [4 k4 S; m$ o6 P* s
(图1)
) o# B9 T0 `: b" {6 ?1 N) H$ _1 g 由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
3 E* }" T! g% E9 Y5 f1 K 因此我们根据1994-2009的数据作图有:
: K; U+ T9 i" W8 ]8 [ (图2)) b' o5 x- |( \6 r
对该数据进行二次多项式拟合:2 K5 R( [8 K2 w X
(图3)
6 y$ j, T& ]: Y6 ^5 ]& I1 x5 X( r5.1.2 模型Ⅰ的求解0 H. P# E/ r; o% S0 d+ |+ ^
拟合所得函数为:
. l1 h/ w! o+ \# W# ^ ;
7 {- c3 M0 ~& H. a; b; B. | 带入,得到:。( P/ A6 @5 W( ^* k: w9 {
5.2 模型Ⅱ的建立及求解2 B( U$ |3 Y" i6 W
由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。
+ C2 c, i; g7 }% I5.2.1 模型Ⅱ的建立
4 S/ P0 V( @, N7 P1 q' m提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:
1 ?5 l. h5 ]& w" s. I8 F* C某年份的中学招生人数如下图所示: R1 L/ ~5 ?9 U; M2 d5 [- Y H
(图4)% ^3 e# o/ Y9 Z' K' c8 r
建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:
4 j3 t. i2 T3 t6 U# e(图5)
/ H' {- b) _% \* o9 K5 R1 Q模型Ⅱ的求解
$ M% ` c" O. ?) S对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。
. Q( Y6 X: D1 Z0 }& J对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;5 G5 Z7 j& w+ G7 V! v* n
将带入上式,得到:。
( z/ J2 h6 f( d* K# R& v5 q5.3 模型Ⅲ的建立及求解
, }* J% D. S2 l 由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。6 t3 j" Z' H4 k, P
5.3.1 模型Ⅲ的建立
# ]) T3 k; m" F" Y 首先对给出各年份的高校招生人数趋势:& ^# P; T2 S( ~8 O
(图6)
9 Z4 A! i% K' I7 B某年份的中学招生人数如下图所示:
6 t4 I. ]! U$ [* V+ X ]' Z(图4)
7 ?& q Q6 m4 T& \2 u7 b# U* f 如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。
" S& B* o$ c, b+ w 通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。3 q" w: {, } |+ L/ X3 b( z( |
5.3.2 模型Ⅲ的求解6 r/ g3 B( s k" ?
对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,2 U4 N/ [( B( b7 }0 E* L" d2 q: u
将带入得,,即为2013年高校招生人数估计。8 t9 l5 d1 y( p, R' i
对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,
- j5 i, x3 u0 {) x& V 将带入,得到,即3年前的中学招生人数估计。
+ u3 A7 q7 e: a8 x利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,
! U* q0 a5 g0 ~$ p" K+ A o 将,带入得。
8 \: ^# E4 h( Y) l# y- P/ k$ D模型的评价与比较: D4 y, |. T6 I& N& Q
第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。
- P5 J, X% J, T; x 第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。
4 z% F4 z# @* z 第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。% }& U3 ~0 D+ B# T! `+ M
在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。' T8 K( B3 U9 C0 w: V5 l5 E8 T
但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。
1 h' w6 M# G, a4 R; i$ y参考文献
6 B( S+ T- }. l姜启源,数学建模,机械工业出版社,2005年. B+ M9 [8 z! Q
吴建国,数学建模案例精编,中国水利水电出版社,2005年
7 s: o2 E, y6 w6 {/ B7 ~3 l附录
) J+ t/ [8 h5 A$ k7 b4 D8.1 模型Ⅰ程序: @3 g& x8 P- {+ E C* D( o
x=1994:2009;
( T5 g6 f, A/ y, [0 F) N9 Z, gy=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];
! b; K2 a, ~6 k! x% bA=polyfit(x,y,2);* `! ~4 {- J! L0 L" ^
z=polyval(A,x);
, s; y* o6 e/ d( _0 M1 Zplot(x,y,'k+',x,z,'r') ;; L, p& f$ T, {+ v) u7 W( d
A*[2013^2 2013 1]'
n5 G8 i' e9 X/ R9 E/ ^4 gans =103.0261
# L) `5 ]$ }4 r0 f7 v! e. r# _! a' V0 W# A* |, Z# k3 Z- l
8.2 模型Ⅱ程序
- f+ k: W" u/ yt1=1991:2006;1 W1 ]0 g# x1 }
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];- e3 a4 N) x! {. {
plot(t1,x1,'*')
% l! i" M0 n6 @' o2 T& p; r' Wa=polyfit(t1,x1,2)
% _- \+ w' ]& ^# h) k9 U {* Q6 E! r* y" e! p/ |, c( c
x1=[85.31 2.4862 125.17;
, Y( i; A3 Z, V2 D: X96.87 3.2745 119.41;
- ^( C( U8 | ]2 i8 S5 w105.22 3.0211 112.21;
% [- w7 r9 G4 l! {116.95 3.2972 115.88;- e4 ^2 u! {0 g
120.41 3.5714 123.8;8 t' y( S/ ~, a1 f @. W; }9 a
118.61 3.4308 125.02;
. y c `8 ?* v4 P% U2 j( A: ]115.14 3.5023 125.52;
K$ J3 b m l- q115.3 3.6067 125.17;2 q3 u% T) Q$ G
115.58 5.7878 123.3;8 Y {9 j$ ^; A* a# Q3 `
115.88 5.7918 125.6;+ R0 {' E3 Y8 O
116.82 5.5036 129.17;
, Q3 [. G8 M( Y7 m& p118.14 5.5611 132.87;
9 s4 `4 g- ?: P122.97 5.6544 139.14;& q- Q! P# s. a1 T$ n; ?$ H2 N
141.95 5.6950 154.67;7 G( ?: s4 E+ i) J' I
159.91 6.2994 167.06;
v7 @8 T! w' N% k164.88 8.2410 169.69;
; P: B0 g( B% t1 @167.96 12.4817 178.19;7 z9 r+ n7 U; Q- K. E" g: O; h8 a! n
188.59 18.3553 201.28;" ?( s2 B [% o* j% E% j! }0 o
205.62 21.8719 222.2;
0 |) E6 C4 L3 C1 X222.82 27.3894 234.18;4 B7 e4 e7 ~. ^
213.8 32.7452 220.94;0 u- y! t* u3 X' u: Q' I3 m0 O
207.29 40.0573 201.65;
* T' a' M, C' T. s. h, A$ L196.7 44.5034 192.94;
- g1 T" K: D' V ]7 }191.02 45.3479 192.32;; K o& V, Z1 f7 x# c5 c
172.88 51.4176 179.71;2 G! G! ~2 v1 q! N4 p
158.65 50.1082 164.6;# [, L' `# @ H+ Z' o
];8 ]* F0 P8 ?9 X$ r
x=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);
6 s0 T) r. E" a, d/ J3 S[b,bint,r,rint,stats]=regress(y,x,0.05)3 ]/ u7 l6 x0 i- S# G1 S
/ P4 A% i% B S% h2 A o8.3 模型Ⅲ程序( @: C8 u9 Q5 R. z
t1=1999:2009;' Z' E3 b r( X6 A2 y* G
x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];
* ^, J% j. [3 x' u0 jplot(t1,x1,'*')! U' q6 V# H% h4 k8 }3 ]! d* e
a=polyfit(t1,x1,1)2 e1 q8 I5 Z. a7 ^) P& r8 C
! K, }- y; z# ~5 f/ ]t1=1991:2006;1 w6 M2 a8 s* E% W4 K4 c( q' L
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];) V! C9 S2 F _" C2 X4 }& }
plot(t1,x1,'*')
! c+ |: z& G/ y" t) |5 A7 Z/ S ea=polyfit(t1,x1,2)
. ?9 z, C& |- l& c) m |
zan
|