- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
|---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况
5 l" Q) V6 i. a6 ^0 J5 ]摘要
& x, c6 F6 N% l$ T9 O, e 该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。. s0 s5 R- p9 a* ~8 H, k
我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。
; o; l, S' Q$ s; h2 d5 g3 p! W6 j 结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。1 [6 g& V4 J+ N3 W$ T
上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。$ I/ S+ ]' X& Y$ h
1 c4 {' I3 p, |& D+ Q
+ [) z9 F' G* R! l. N- k
' y) R5 { X. m
- v- y0 ]) D' z: B* o/ _
0 J4 ?4 ?/ b/ G: b; j8 I
" G! g" A- h) G9 U8 F2 M1 o) r
3 i- b; N7 ]# y5 Z/ W
0 B6 B" g |8 W! t. X" m$ e
关键词:直接预测法 间接预测 模型改进 三种模型 误差分析
, ?3 Q, N, C9 N5 m / h# j. j) [- c4 r3 n& E( x
6 K" P0 w$ I# }$ i O9 q 4 V$ q- {) ~* j9 u# Y2 r$ Y7 @- H, a
1 Y, \9 d7 a: ~4 ~8 [" z6 a3 _问题重述
# O. u7 O3 w+ [2 |. l0 K 该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。
7 o' @) P- s7 `& ^! q问题分析
/ U, l8 w6 d# r/ L" y; J" V: ]8 b- ] 要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。. I- Z: \; h: P2 t: p- c6 `* E
对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。3 ]1 X, [# y. ?, S
模型的假设9 H/ H! T, x( I( G% n% s
表二所给数据为普通高中的数据。. E) ~" O4 e3 N! J4 L4 Z7 [- u
高中生源情况以高中毕业生人数来估计。
. a8 x: l: U$ x定义及符号说明0 f' x; b3 {3 I5 O) }% v( q
:模型Ⅰ的时间变量;
) R# s6 L8 L5 N, b/ Y) t- j:模型Ⅱ的对于高校招生人数的时间变量;) U* G2 I8 B, j+ p
:模型Ⅱ的对于中学招生人数的时间变量;
1 I' ~% c; z; A$ C' n7 x& E, _:某一年高校招生人数; I3 u% @1 A' k+ I
:某一年中学招生人数;( i& f4 ^) P/ j8 O5 H
:某一年的中学毕业人数。
- {9 n8 y+ C& S. q1 q t" f" O模型的建立及求解
7 l' E2 m( d) P& L8 n( Z5.1 模型Ⅰ的建立及求解
) b. z, N6 H0 |, y* | 由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。
& R5 y5 a/ P4 f% ~+ x/ q y5.1.1 模型Ⅰ的建立! C6 @! l4 j) v. V
提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:
% I ^9 M( H9 c( a2 k: y( C5 n (图1)
: x% J% i; ]+ X; e 由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
: \# t+ W% S% g5 X- ?5 {9 r. O 因此我们根据1994-2009的数据作图有:$ Z4 i% Y* {7 T% {6 o
(图2)
* g# h2 _8 q4 E" K& N# l 对该数据进行二次多项式拟合:6 X. D% ~: x& I$ F* [: o' M& V$ ?
(图3)% s! k3 y0 D4 Q2 l9 S, U
5.1.2 模型Ⅰ的求解 Y, Q+ T+ m0 R9 ?
拟合所得函数为:
9 v1 v. v8 F6 T; j! Q ^ ;
! K0 L! P( k( }: s) L7 w 带入,得到:。
Y4 W4 K/ C6 X4 `$ c' t8 Q& j5.2 模型Ⅱ的建立及求解
/ k* _" u( `: P4 x 由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。4 C$ b K) w9 o, Y
5.2.1 模型Ⅱ的建立6 j7 w0 {; A3 R
提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:4 P. w" k. l7 J
某年份的中学招生人数如下图所示:2 }! d( @4 G7 ~& r) R
(图4)
7 B( S! @# M' R建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:1 H6 D6 \6 U3 Q' q5 A
(图5)
1 _% a! D8 @* W. q; _& X% N模型Ⅱ的求解
+ V* A$ p% ?- A8 F9 Y* j, X对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。
% e& r9 ^# E, p6 {对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;2 A5 A1 V+ `* n; Q8 `- t
将带入上式,得到:。( }. F: S- @4 ^1 U# s
5.3 模型Ⅲ的建立及求解5 ?" C( [7 |. s8 c3 x) J/ N
由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。
1 Y7 f2 g- `" {4 B. z) P! n) O5.3.1 模型Ⅲ的建立
8 D+ A4 s* p# h7 F# `3 t 首先对给出各年份的高校招生人数趋势:1 S: v( }! f; K) X
(图6) ?' q4 W! {5 c+ l+ F3 N& @ @6 Y' _
某年份的中学招生人数如下图所示:& E, K# A: k# o% s+ C2 _
(图4)
$ W6 k3 | d% I: R) U 如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。
. G3 Z- X# R+ i5 r% V: T 通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。! s$ k9 X9 e; m1 n; M8 v/ w
5.3.2 模型Ⅲ的求解- f- C( B; b8 O6 B% t
对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,4 i9 E2 G6 u' }2 s3 w1 V
将带入得,,即为2013年高校招生人数估计。6 c, G. K: ?7 Q+ {) g4 n3 D
对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,% b8 _6 {2 I* `
将带入,得到,即3年前的中学招生人数估计。
# q2 N/ y* H( ?: N T- }2 v7 U0 l* @+ k$ `利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,, A4 w% d! F, r+ m$ r; ~3 m @3 x2 A5 h
将,带入得。 s) m! i& z- A1 V8 E
模型的评价与比较
* i3 y, ~7 b+ u+ a 第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。
# S8 ]( ]* T: ~ 第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。
. S/ N% w1 U) Z 第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。
. X8 M/ v9 I0 Z 在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。/ b: c+ @: a# a+ J. o! P
但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。
|& L6 ?& u9 R0 L8 D+ o参考文献* W9 b! i( v- t b, v2 E
姜启源,数学建模,机械工业出版社,2005年" f% m: G9 K V+ Y. k F) r
吴建国,数学建模案例精编,中国水利水电出版社,2005年
$ C% n* F' v) T7 X% P附录
2 m9 M6 i0 k4 A) L o) ~8 b8.1 模型Ⅰ程序- s/ @' B3 ^8 r4 ?0 M0 w7 s
x=1994:2009;
9 b, S: c5 b* {6 N8 f7 h* O) my=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];1 [) a$ @4 q# d0 R7 k
A=polyfit(x,y,2);6 C! Q' R I; d: P/ \' b6 j. X
z=polyval(A,x);, {6 ~* }" g# d! C
plot(x,y,'k+',x,z,'r') ;
! n( ?' j" b8 |2 ^, F, H$ RA*[2013^2 2013 1]'
8 o8 g' [$ n' I; ]% _ans =103.02611 T/ I. d6 v* w4 A8 c( i
! R- Q" r9 t# b- L: `5 w. f) U3 d
8.2 模型Ⅱ程序
) a- o8 b+ a9 \t1=1991:2006;0 R# H( p0 y( i4 `, R% {3 I
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
: J L& G p7 `7 G6 M' qplot(t1,x1,'*')6 n6 r! \: O K% } z
a=polyfit(t1,x1,2)
! p% r( E1 _/ L9 ^ 7 I; X- D2 r- |+ F( J* l/ v1 k! J! H& o
x1=[85.31 2.4862 125.17;
: Q7 {0 A& r- l- X. Y96.87 3.2745 119.41;
$ u8 X7 G0 o7 b' [# n- W4 N- T105.22 3.0211 112.21;
8 V9 M0 u$ i) B' {. Y4 b: ]116.95 3.2972 115.88;- W" Y# b" z; l- O. t7 f7 S2 L
120.41 3.5714 123.8;& {% C& M1 f7 |
118.61 3.4308 125.02;/ c Q' G4 {% Q# V
115.14 3.5023 125.52;
. Q+ c, T' s) Y; s$ A0 J( E/ [115.3 3.6067 125.17;+ O( w" T+ ]; q; d- t2 \
115.58 5.7878 123.3;9 L7 ~6 p# p- M) L# \) ^
115.88 5.7918 125.6;) e, L& Q3 y: N& w3 C( K- G: ~
116.82 5.5036 129.17;( n7 I! k: t5 I d! y
118.14 5.5611 132.87;7 w7 V( p2 A, r" \6 v
122.97 5.6544 139.14;) u# z. G2 S! f, }
141.95 5.6950 154.67;
- w4 n. |. Q5 ` ]: g. J# V+ m0 x159.91 6.2994 167.06;1 Q. U4 {& H( m; u$ W$ U
164.88 8.2410 169.69;( s/ t2 e$ X2 A) H; \" P* l! C
167.96 12.4817 178.19;; p1 b" o' M$ k# c
188.59 18.3553 201.28;
7 f7 A8 a! |" r' ]" X5 y$ F8 A2 ?205.62 21.8719 222.2;
/ E2 c5 u* v& M+ ~' ^% J+ s222.82 27.3894 234.18;% {: b% e2 g- ^, ^5 E: u1 h# I4 w
213.8 32.7452 220.94;" S3 h' G+ S# y5 Z8 X
207.29 40.0573 201.65;% Y; V3 ^$ ~' x& H/ Y8 C
196.7 44.5034 192.94;$ z2 U. T5 F, W; F+ E
191.02 45.3479 192.32;
0 L& N+ P4 ~# |- R: t172.88 51.4176 179.71;
; Z- R# G' `2 E( J" X5 I6 H/ W158.65 50.1082 164.6;
: P: ]% C* `8 ]" D M& [];+ _+ R% h% q' @3 W
x=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);/ y _$ C" x" P9 x% ?, ~% r
[b,bint,r,rint,stats]=regress(y,x,0.05)1 m2 D. a2 w0 _
7 k: L, W1 X; P
8.3 模型Ⅲ程序
% J) v. l* U; It1=1999:2009;
$ v; y q+ A! j) c- ~) Sx1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];* X/ ^0 q6 {" W P+ b! Q
plot(t1,x1,'*')
" S" E7 L* I- p, l% ~5 J. E# U9 Ea=polyfit(t1,x1,1)
- M3 c2 }/ p- B% o 1 H7 N( K, @1 v& z+ l
t1=1991:2006;
0 j) p) e" a5 w+ Rx1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
: J, u6 t$ c' s) T) F, m. W' oplot(t1,x1,'*') y; P/ d' G U6 q8 p$ t
a=polyfit(t1,x1,2)
# n& R1 N. ]7 m$ _8 ` |
zan
|