数学建模社区-数学中国
标题:
高考生源预测
[打印本页]
作者:
775128646
时间:
2011-8-26 21:39
标题:
高考生源预测
预测2013年山东省高考生源状况
( x& d6 V/ S: L7 }0 |8 \
摘要
( t9 A9 }" O+ v8 y- P: G
该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。
' K* T4 ?- L7 v+ w' {( Z
我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。
# O. D- C! P% {, B" N; R
结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。
( m8 g6 t# _0 ^! d3 x
上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。
& G9 R, P5 X$ F p
9 e) a) D) F1 z
2 l% f5 P. e4 v
% {. U- D2 L( X" e+ {
1 ^) k% }! f; s8 c
( d, _/ }- k( r. v: Y
c0 p2 `" }9 k9 X
- p0 t7 z3 {3 V
2 e! m, z+ _/ O% n, D6 P! R9 [. _
! H: N+ J" h3 J! V: L& a
关键词:直接预测法 间接预测 模型改进 三种模型 误差分析
$ R/ R! n) j0 z4 _9 x4 \! S
9 w! j! j' Z5 g) C& u5 d$ o
, V2 j8 `0 Z- y) {! q
+ Y% q5 N& ?( Z6 q, h0 ]7 W
' B9 d+ d2 N5 X# `1 L/ W8 w
问题重述
[' K |9 U! U2 @1 B
该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。
, m7 i |) a, M7 M0 h# }2 @9 K
问题分析
' t1 s, Z) a5 r/ X5 v4 ~
要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。
: W- y4 t3 E# j" K* X* m% T! @7 B9 F, T
对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。
/ ?5 r' D* [ t' p O
模型的假设
/ `/ S3 x9 r, H+ s% L
表二所给数据为普通高中的数据。
+ R5 C' g3 o& P3 |8 V j
高中生源情况以高中毕业生人数来估计。
& E9 U, D |( x. @! a
定义及符号说明
# C. P! M4 L1 P) P5 B
:模型Ⅰ的时间变量;
8 [( c$ E: Z3 ~3 w$ }3 Z# P
:模型Ⅱ的对于高校招生人数的时间变量;
( E9 t1 Y; L: Z: W% |( I, |- M: [
:模型Ⅱ的对于中学招生人数的时间变量;
& L/ U, x0 A* G8 e% d- S" P: [! a
:某一年高校招生人数;
3 X8 _* Z/ ^) d1 f' |
:某一年中学招生人数;
: @$ W' G* ]# d
:某一年的中学毕业人数。
1 q- w* r0 N6 w" [: l. L( L
模型的建立及求解
8 d+ Z- y7 ]. ~2 Q$ N6 Q
5.1 模型Ⅰ的建立及求解
7 V' [' ]" i5 f; H& w
由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。
1 _! F* M& T6 z# ~6 k3 u
5.1.1 模型Ⅰ的建立
6 e$ R2 z9 x+ G5 Y! G
提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:
$ f' [' R% y K, @) ~+ a8 h- z e7 Q
(图1)
: M$ T& I" i; P( o" e; J6 P
由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
$ F7 x8 C2 o# k) x- I
因此我们根据1994-2009的数据作图有:
- S" c3 j! l* S8 @ g, F- ]
(图2)
7 C7 @6 Y+ N; g; Y, U
对该数据进行二次多项式拟合:
0 r$ D4 p" r j, W) y
(图3)
7 K' H" S( F& h, |
5.1.2 模型Ⅰ的求解
$ y2 U" ?0 l( d6 ^0 ?2 W+ Z
拟合所得函数为:
2 x" u5 g$ I+ X1 ]# O4 _* }" A
;
5 Q$ B$ o. `0 ?9 n7 w" l0 `! s* }
带入,得到:。
9 E n# u. l$ O" O8 z2 _8 \
5.2 模型Ⅱ的建立及求解
+ K6 B( ^- t5 V+ l7 F
由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。
) W: `% i! h* B1 s4 k2 k9 B( O
5.2.1 模型Ⅱ的建立
( s7 s; G3 T; P r2 F
提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:
5 `& ?; |& K- i
某年份的中学招生人数如下图所示:
8 l& Y% X ]3 ^% @2 B9 v/ q
(图4)
5 q6 S+ x" h9 u J9 B
建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:
6 s* `: M' b- D w* y, d% I
(图5)
" L, ]$ U4 y' m
模型Ⅱ的求解
4 p- g$ ~: o; C+ v7 X n% g/ V/ D0 J
对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。
- K, a: F: f# N4 b ^
对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;
6 r+ d/ `4 Z# I7 u% P% U
将带入上式,得到:。
$ u* h- T3 E* C; U) {
5.3 模型Ⅲ的建立及求解
" V% l9 {* a" U5 G
由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。
7 W4 V! r @+ E1 o+ N& _
5.3.1 模型Ⅲ的建立
8 `% C* X' Z6 |( V, \
首先对给出各年份的高校招生人数趋势:
3 q# E, l2 \8 l6 |
(图6)
1 d" b! L) T: `$ x& t3 w4 V. j; @6 v
某年份的中学招生人数如下图所示:
$ `. d- c6 L( a" m; a7 [" `
(图4)
4 W6 {4 _1 x5 s
如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。
5 o( ]0 W/ x3 X: y
通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。
0 |; Z5 J' i) X; s
5.3.2 模型Ⅲ的求解
' N. D4 z6 @5 L8 r
对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,
7 U! ^9 w0 {1 s
将带入得,,即为2013年高校招生人数估计。
' G) r9 b% N% P2 s$ [
对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,
r1 A: _ ^; E; {8 |# F2 T
将带入,得到,即3年前的中学招生人数估计。
8 l$ e% G8 b* }3 U. U; }3 J( e; }
利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,
: ]% M: ~) V" Y( E* ?, ~
将,带入得。
$ ]; F2 c: B t; f& i
模型的评价与比较
# f/ i5 ?7 t1 K7 I0 g3 D
第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。
6 j$ G! Z# v, |! l8 i4 z
第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。
9 {1 b2 | n* T7 @
第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。
$ u' J$ ~* o$ m# S
在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。
3 U8 S1 p! Z# g# i
但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。
' f& Y* @) O0 o% E( x! B
参考文献
0 S$ C, s" @" s J; q. E$ _
姜启源,数学建模,机械工业出版社,2005年
7 i4 T- s D9 [ E$ r1 f+ B
吴建国,数学建模案例精编,中国水利水电出版社,2005年
: \/ B4 r5 V) e
附录
; E- O% y" l3 n5 q3 H3 I* j; p
8.1 模型Ⅰ程序
; k" R/ r v- ^
x=1994:2009;
6 }( V- y* _+ D$ v0 B6 k7 Y
y=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];
) n( r5 U: ?9 j; _
A=polyfit(x,y,2);
" d- P5 j# X1 p$ L4 {
z=polyval(A,x);
* }2 H' C: X) k8 Z
plot(x,y,'k+',x,z,'r') ;
! {0 |% b8 Z L! }
A*[2013^2 2013 1]'
9 a/ C0 ]8 H% ]% l
ans =103.0261
1 m7 }/ i, B. ~7 N" ^
" o4 u$ l' W x4 ~- Y& }
8.2 模型Ⅱ程序
- _2 I! x n2 U$ m, V
t1=1991:2006;
0 m: j! o+ w' K+ A% J) \
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
1 i! D" x& j# ^
plot(t1,x1,'*')
, w9 r/ `0 I3 b1 `# @& U0 r0 m
a=polyfit(t1,x1,2)
0 ~& j, ^: f; X* a) u
. ?7 w7 B9 R1 ]" F
x1=[85.31 2.4862 125.17;
( f0 p; s8 \5 k2 o/ D, ~) Z! c
96.87 3.2745 119.41;
6 q- S+ o+ }% }7 I/ A7 }
105.22 3.0211 112.21;
3 a( D# g9 j* ^8 k
116.95 3.2972 115.88;
+ c P2 J9 V2 _) S/ t4 D0 e
120.41 3.5714 123.8;
/ N0 Z* Y' G" a$ n5 |
118.61 3.4308 125.02;
; {9 y, b% c- k( _; Q4 } ?8 A5 \2 _+ C
115.14 3.5023 125.52;
' v" Z" R$ d; M [. Q
115.3 3.6067 125.17;
0 u" B8 H+ I3 n0 b' |
115.58 5.7878 123.3;
o- t; Z+ t9 y+ n k0 q
115.88 5.7918 125.6;
& x: L1 i7 O3 U1 B0 ]) n( Y
116.82 5.5036 129.17;
% X) l m3 J- n6 n
118.14 5.5611 132.87;
4 H+ a. }2 }3 g( B) g( W, P8 N
122.97 5.6544 139.14;
/ ?% Y! ^& e4 I% `
141.95 5.6950 154.67;
% r8 T& [2 F' O+ M% }) f3 a( O
159.91 6.2994 167.06;
1 X0 r4 Z) a' Q) f i: W0 a- L
164.88 8.2410 169.69;
D0 X' v. H6 F- F( [) W: z _. o' ]& a
167.96 12.4817 178.19;
3 V" y1 ], b$ L( W1 y' E
188.59 18.3553 201.28;
/ \& c6 t$ x# \
205.62 21.8719 222.2;
8 a. \( ~5 }3 O* l: Z' H
222.82 27.3894 234.18;
, T2 Z" j6 V# x
213.8 32.7452 220.94;
% O( Q X1 ~( Q9 c; ~* R6 b
207.29 40.0573 201.65;
& e! A$ z1 x9 ^
196.7 44.5034 192.94;
* L% W$ y; V+ V; H" W; q+ r1 [
191.02 45.3479 192.32;
3 X6 Z- ?# u( Y8 J$ `9 X9 k
172.88 51.4176 179.71;
$ {/ |% ?+ A( Y
158.65 50.1082 164.6;
' a/ n# K; l# J: f+ L6 _3 {/ i0 n
];
* U8 U2 G/ n2 Q4 B
x=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);
9 P/ _* B9 ?& s& J; J$ b! q6 v
[b,bint,r,rint,stats]=regress(y,x,0.05)
7 T, E3 D$ D$ K$ ~3 A6 M
; h0 r# c& q3 u7 w( j: h
8.3 模型Ⅲ程序
4 w) m6 m( H3 _
t1=1999:2009;
! S! X. q) @1 s% l& O* D! }' Q
x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];
7 Z# B# R& e8 {) G. ~" b
plot(t1,x1,'*')
+ w$ T8 ?. i% s# w
a=polyfit(t1,x1,1)
( m) @4 k0 j! j- \ t
# ^! \7 N V9 E0 V4 ]! h
t1=1991:2006;
+ E2 G9 V( C: O; e, r
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
; q. a; W' m$ I; S; I
plot(t1,x1,'*')
n$ ]* r0 {) N4 k/ p
a=polyfit(t1,x1,2)
1 i0 A/ o2 v% m/ _* W! P `
作者:
775128646
时间:
2011-8-26 21:40
看看哈都
作者:
心馨
时间:
2011-8-27 08:39
论文啊、、、、、、、、、、
作者:
hgh158168
时间:
2011-8-30 21:17
数学教学对策的思考
作者:
wtdong
时间:
2011-9-1 10:10
作者:
fkusa
时间:
2011-11-21 18:03
真的很好啊
作者:
陈健康
时间:
2013-3-19 23:50
我使劲回复,就是为了看一眼论文啊
作者:
陈健康
时间:
2013-3-19 23:50
我使劲回复,就是为了看一眼论文啊
作者:
576683159
时间:
2013-9-1 09:22
建议利用概率,与灰色预测
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5