数学建模社区-数学中国
标题:
高考生源预测
[打印本页]
作者:
775128646
时间:
2011-8-26 21:39
标题:
高考生源预测
预测2013年山东省高考生源状况
# p: y( H* E7 v* k4 C
摘要
4 R k1 |6 I6 A' M) [
该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。
9 [# ^7 _6 q" l5 I
我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。
% a1 p+ j4 A7 T7 @% l
结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。
: x7 u. ~; k, s; ~! s& V0 Q" k5 G
上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。
6 c& d* P1 k: y1 C* Y
0 H- ~, Y0 w, A. c" h1 N
- t' B2 |& ~/ T; n b
) g* D/ {8 H1 v0 ?
* s$ p! k$ P, Z0 P
& k2 D' ]1 g# b: \+ [6 T& b* ^
- T( m& k' r8 Y7 ]6 K
2 U' K! R: \% r; C. w' O! ?2 _8 R2 S5 s
* o) P% q) [) J; X0 \% z# x$ V
( G# N1 A. p* d4 `! q! d5 j
关键词:直接预测法 间接预测 模型改进 三种模型 误差分析
1 K/ m2 i/ P6 a3 Q( k
; b0 m9 H# m9 X2 z# z2 J
6 B: N. h: b+ t! K
/ V7 S5 K, j. z1 [7 c
- m+ m" Q* M9 q2 {
问题重述
; ~0 D4 e2 x# p6 H& [) M2 S$ G
该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。
- x+ F' F2 ^! J% o. C( W( W
问题分析
4 i2 I6 X+ V3 G S" {: _- L0 c
要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。
4 T5 c+ e; ^# E8 G. o' C% c
对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。
0 z: m. h$ l% a
模型的假设
+ K5 T3 r% Q( z3 E) Z+ y3 o. k0 k
表二所给数据为普通高中的数据。
- X* p3 B4 U$ F' \
高中生源情况以高中毕业生人数来估计。
$ }: S( V3 u% E- z& L1 }
定义及符号说明
( |- k# c' ]( e% `
:模型Ⅰ的时间变量;
6 @% ~: J& t& [3 \
:模型Ⅱ的对于高校招生人数的时间变量;
' Q2 N/ r" z( e, I
:模型Ⅱ的对于中学招生人数的时间变量;
( Z0 a8 _4 q8 Y, W: Y( L) _
:某一年高校招生人数;
. l9 p+ l; ^ |5 V, e) G& p
:某一年中学招生人数;
% r* ^1 x4 N7 D8 k! l
:某一年的中学毕业人数。
& v- M+ x# q' `& p) P7 p
模型的建立及求解
5 P9 l/ v6 q, m m, [& L
5.1 模型Ⅰ的建立及求解
) o$ a( x# r1 L, q2 y
由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。
9 U3 q" k+ C% s/ G1 F( r/ @
5.1.1 模型Ⅰ的建立
$ t8 x/ a" J8 _ H' O7 u h: }2 U
提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:
6 S' Q" e P3 B0 g7 ?
(图1)
/ Q+ |# O; T) w% {
由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
0 m# ^) H5 |2 N( O3 u6 _$ h h: b
因此我们根据1994-2009的数据作图有:
b( Z- E$ b$ `( n# Y2 M+ `+ A% H3 N
(图2)
9 p0 P) @0 @' T }# q0 {" v
对该数据进行二次多项式拟合:
/ O: w- v" P' \; J
(图3)
. @" u* T$ x& ^. I
5.1.2 模型Ⅰ的求解
+ j" h4 e/ X R9 t) ?! c
拟合所得函数为:
2 @7 ^( ]8 ^$ ^1 n9 V, a1 `
;
* s# |7 y6 i$ B5 U7 }
带入,得到:。
/ v9 }$ z# Y' \# F4 U( Q8 T( m
5.2 模型Ⅱ的建立及求解
: Z- A4 q9 f+ ~$ Z8 u b" W
由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。
$ G* x$ K1 |6 u" \: l
5.2.1 模型Ⅱ的建立
# `( i7 i4 J% ?
提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:
. {# e* Y- I( z+ T
某年份的中学招生人数如下图所示:
% e# X! e7 l" z4 {& W$ d9 }
(图4)
- z9 e, ?. U9 Y M: e- S- `; O) t
建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:
5 ~1 h1 g+ z. C- p6 o& Y
(图5)
3 i; i1 T3 e' {
模型Ⅱ的求解
1 Y% J. e* \; i. U- {# S
对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。
3 @% A3 o) \$ v }
对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;
7 l( [ _+ i6 M% s, g6 F1 t* M
将带入上式,得到:。
. \, w9 w6 \8 W3 Q; W C; a V
5.3 模型Ⅲ的建立及求解
" J1 t6 d! l" p k ?7 ]( _
由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。
( |/ m$ j: \+ g& U& O/ c q
5.3.1 模型Ⅲ的建立
* Y+ A# S2 q. M2 u( U
首先对给出各年份的高校招生人数趋势:
, v2 Y5 g5 X( e! i# B" Q( \
(图6)
* U" D0 X1 ?1 _
某年份的中学招生人数如下图所示:
- t' O, m6 R X. I$ e1 O
(图4)
8 Z! g) T' k4 X0 A# Z$ [) m) V
如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。
0 e+ h2 Y: y+ ]5 ?1 l
通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。
4 }" u- h$ v8 }, U1 p l' s
5.3.2 模型Ⅲ的求解
4 ]# h+ h; g- U X; q6 }$ R
对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,
1 Z' B5 v. M+ x3 y4 d5 K
将带入得,,即为2013年高校招生人数估计。
: O5 Y/ ~7 \- ?: f( O5 K
对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,
$ D# g( T/ i3 c$ i8 n
将带入,得到,即3年前的中学招生人数估计。
/ n6 x$ r$ h6 t5 J. J+ X# @, ]
利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,
7 T( y2 y7 K$ t
将,带入得。
# s3 U3 \+ |7 a9 V- ^
模型的评价与比较
& x* B6 [. e' Y5 g; \0 D3 r
第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。
) d; Y2 y0 U# @! s" p
第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。
5 x! Q' M6 t$ D$ a' [, X* r1 F1 e' H& R
第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。
. E( W% _' k* C& V: x* ^" p! [5 X
在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。
; P, ?& G6 J( L3 c+ ~+ N$ y, c' G
但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。
/ r+ {! F& u) g
参考文献
" o9 H0 J6 X: u
姜启源,数学建模,机械工业出版社,2005年
4 L1 t* i; C6 B. _9 o$ H& e
吴建国,数学建模案例精编,中国水利水电出版社,2005年
$ m: u, e# b# O
附录
* n+ b" E" P/ l$ Z j$ a) N
8.1 模型Ⅰ程序
/ b* B/ C0 I, B& Y
x=1994:2009;
1 _" t$ H+ K; T% ]
y=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];
3 I/ E# ?. f* V$ u x+ a9 C8 T2 A
A=polyfit(x,y,2);
. {/ e# @, e4 \9 v6 [5 b7 x
z=polyval(A,x);
( w6 x! z+ Y! `" ^7 n+ o
plot(x,y,'k+',x,z,'r') ;
B. v _* I: U( x$ D
A*[2013^2 2013 1]'
4 f% Z: G& }" b( c+ F+ L6 ]+ l
ans =103.0261
, T& P8 i8 n$ {, Z$ W' e
% W9 c/ E A4 R5 m" E. }. Y
8.2 模型Ⅱ程序
4 r. F* J5 ~( _6 M) {# C" P7 r
t1=1991:2006;
) w2 k7 ]' _) c8 f/ @
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
9 d" k( H; B/ l* `$ k9 H5 ^7 ?
plot(t1,x1,'*')
( \. e6 m1 z1 N/ v+ \
a=polyfit(t1,x1,2)
# s) }$ y% h J* o
4 b8 v/ J. a+ b5 R6 g) z
x1=[85.31 2.4862 125.17;
; z! }4 V4 b* @% a1 l( i4 i# A1 u
96.87 3.2745 119.41;
& T* e: l+ ^0 s/ }. L: R/ d/ x
105.22 3.0211 112.21;
! }; S# X1 L1 v& ] V4 Y
116.95 3.2972 115.88;
h% K, ]% J8 {: w. ^, v
120.41 3.5714 123.8;
: {3 h, `# n' `
118.61 3.4308 125.02;
0 V7 h2 ^0 j8 k
115.14 3.5023 125.52;
, C" a" S8 X1 x; {6 Z
115.3 3.6067 125.17;
4 d( a/ ~: s3 O
115.58 5.7878 123.3;
+ R' F$ Z, z! i
115.88 5.7918 125.6;
* p# Y7 N1 e' {/ ?0 f
116.82 5.5036 129.17;
% t* Y0 D6 ?5 Y3 Y1 }
118.14 5.5611 132.87;
' D% F8 F3 h/ |& w5 h9 {. j
122.97 5.6544 139.14;
2 a$ M6 p, {5 z) N# L( U
141.95 5.6950 154.67;
0 j2 q7 y P9 C/ J/ k( x' v4 V
159.91 6.2994 167.06;
! v3 K' G4 r4 e3 ^6 G( a
164.88 8.2410 169.69;
. L/ s: ?" ?8 m" g
167.96 12.4817 178.19;
2 k, q: P9 b( v
188.59 18.3553 201.28;
9 f+ E/ N% x$ c: @% p
205.62 21.8719 222.2;
5 {; w2 ?) d" U
222.82 27.3894 234.18;
! h+ f( e: q/ e" q3 S+ k9 M% h7 w
213.8 32.7452 220.94;
9 X0 u: K6 y8 l4 r- L7 r. p
207.29 40.0573 201.65;
4 U/ n) \3 x4 o" c: A/ y; \
196.7 44.5034 192.94;
& V6 R' h. p+ ^3 m( T3 [, f
191.02 45.3479 192.32;
2 `& u& {5 E( X: P' H1 E
172.88 51.4176 179.71;
2 M4 d0 |# ^ u+ m
158.65 50.1082 164.6;
5 M- p7 v! ?6 U" z/ W
];
6 a- Y/ |4 [* c4 {4 Q
x=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);
" |( X+ o% z/ D3 C1 V* o
[b,bint,r,rint,stats]=regress(y,x,0.05)
! k7 m5 \3 D5 Z; d2 O* U% f. p) [' }
1 e! M8 f, Q& |, b5 J5 `
8.3 模型Ⅲ程序
+ r+ t2 e( V5 j- {8 _
t1=1999:2009;
! v4 K& j' b" U' p7 r
x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];
4 a( m7 m6 N W2 E* f" t8 H
plot(t1,x1,'*')
5 h. o% D- J4 s+ H
a=polyfit(t1,x1,1)
- J/ x6 O% r0 x _- N
7 w @( W4 O, I z* y( h; f
t1=1991:2006;
. i! O5 r2 a! {9 }) Z+ c) n0 ~
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
% R) b/ K2 b4 ^ J: i5 o
plot(t1,x1,'*')
6 Y0 b0 |; N! X9 G5 p1 N
a=polyfit(t1,x1,2)
( t4 B+ v6 c' |6 p& j
作者:
775128646
时间:
2011-8-26 21:40
看看哈都
作者:
心馨
时间:
2011-8-27 08:39
论文啊、、、、、、、、、、
作者:
hgh158168
时间:
2011-8-30 21:17
数学教学对策的思考
作者:
wtdong
时间:
2011-9-1 10:10
作者:
fkusa
时间:
2011-11-21 18:03
真的很好啊
作者:
陈健康
时间:
2013-3-19 23:50
我使劲回复,就是为了看一眼论文啊
作者:
陈健康
时间:
2013-3-19 23:50
我使劲回复,就是为了看一眼论文啊
作者:
576683159
时间:
2013-9-1 09:22
建议利用概率,与灰色预测
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5