数学建模社区-数学中国
标题:
高考生源预测
[打印本页]
作者:
775128646
时间:
2011-8-26 21:39
标题:
高考生源预测
预测2013年山东省高考生源状况
( A0 a6 ~8 y g. k9 w. U
摘要
+ f8 b: k+ q5 K6 y/ r- @" f) p
该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。
# H& m9 M. W* [" z
我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。
; N- ? V/ _. t+ x
结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。
, t; v' ?5 i0 e2 x4 j
上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。
6 Z' V! k$ m$ V3 v" Y
+ j! _7 m K4 h& r \+ V
! h( G7 B$ [# V' ~' A+ H
; n3 n( N+ D" D2 j& Z7 p( e
7 i) ^$ Q$ {' y- i6 r- C2 q E. m
: c; V1 Y2 l4 C: t2 s5 `7 G
( m: @1 Z- H$ p6 D1 t; t
' b) o N8 v9 Q* q( T4 ?5 j& @
5 ^( d& Q# q0 R- Q( l
- u( ^& W1 w3 d+ i# f) j7 z
关键词:直接预测法 间接预测 模型改进 三种模型 误差分析
% Y& g' L; e/ _
/ Y# r" ~; F, s6 f
% h& \7 N0 y$ x; `; Y) O: D9 \5 U
9 s* \$ {4 J) n1 D1 i) N, O- `
2 w- d$ p3 Y# a- K/ k4 w
问题重述
: J$ @. `, X" L4 b
该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。
. d* E+ m) E1 d P; ~- ~2 c- Z( g
问题分析
% N. f( L9 W! h! e9 R. q! p5 ?
要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。
. B+ H7 w1 V$ B( ?; n2 X1 l
对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。
% |& m7 b8 W$ N' W6 u: R# |6 }# y
模型的假设
* r( \8 e# C2 _# C0 p3 Z
表二所给数据为普通高中的数据。
2 T8 i# ]% s- Y2 x3 L0 b8 w
高中生源情况以高中毕业生人数来估计。
5 ]) S5 ~3 _2 z3 |7 x4 v+ v$ L
定义及符号说明
; K1 b1 s$ l# ?; c5 l: t7 @
:模型Ⅰ的时间变量;
5 _7 B5 Y8 ]& ]9 e% {4 ~; k
:模型Ⅱ的对于高校招生人数的时间变量;
0 z! `) C7 n: l! Y% @3 A( O
:模型Ⅱ的对于中学招生人数的时间变量;
- c' D& P/ c6 Q6 d P2 W
:某一年高校招生人数;
; O0 X& Q% C( R% l2 }6 F% @
:某一年中学招生人数;
5 n1 ]( `0 h& s8 f% [
:某一年的中学毕业人数。
& u. q# d/ \ z U. N
模型的建立及求解
7 V9 ^2 B! y. f* _
5.1 模型Ⅰ的建立及求解
) `, `8 {$ @& o9 I+ g- M* G
由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。
% ~ Z0 J8 m1 l4 s
5.1.1 模型Ⅰ的建立
2 \; Y6 T1 A' m) o; W( @. p3 V
提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:
0 x( B" m6 n: [$ B4 K( j( m: H$ ^
(图1)
$ P* d- n7 {4 r+ M
由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
( A& S( A4 l! C* m* N. i# n+ D; u
因此我们根据1994-2009的数据作图有:
. C( c& s$ v" ^; H# r
(图2)
6 s8 L/ x$ P$ I1 m' B
对该数据进行二次多项式拟合:
' W% ~7 t- \7 S4 k
(图3)
1 a# u8 {+ l$ L7 g% x/ D3 z6 V* _1 x8 N
5.1.2 模型Ⅰ的求解
0 s/ E1 f; v8 c6 K6 w$ t
拟合所得函数为:
& J' u8 A7 V0 @1 j& [# a
;
% R1 P$ } z! @! B0 d
带入,得到:。
$ @7 ]& Q" R& R A3 m$ y5 y
5.2 模型Ⅱ的建立及求解
5 j! G3 ^ p' w
由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。
) r5 q; o( T4 Y2 g2 x; \
5.2.1 模型Ⅱ的建立
! K) c7 z A' y& P8 M2 J# p
提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:
# D8 s8 H' J: A0 t$ F
某年份的中学招生人数如下图所示:
2 ?% x. }& O; }4 Q
(图4)
0 ?3 c, ^& {; P: P& H8 U
建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:
1 x: U1 G+ j2 S3 H9 C, Q! Y$ A
(图5)
/ E" l* h% k+ z5 C% W/ g" F
模型Ⅱ的求解
/ j! E7 M. ~9 _" |
对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。
: h- b2 g; C1 m6 v" H2 M5 D3 I
对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;
# j9 d3 y1 M" [. q! X: e, {
将带入上式,得到:。
+ k7 l% i+ c1 @8 b( h: a! C* ^
5.3 模型Ⅲ的建立及求解
$ p! t/ Q5 m! m" v8 `% d8 j" y
由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。
6 _4 `8 W w6 A% a3 c2 M( P
5.3.1 模型Ⅲ的建立
P' N; U) r+ I* G, Z: Q/ b ~
首先对给出各年份的高校招生人数趋势:
5 S3 J" \0 t9 [- U
(图6)
* l! T) k- V. }& Y4 n
某年份的中学招生人数如下图所示:
6 T7 [4 t9 S k7 Q0 Y9 P
(图4)
' l# o' G8 P L3 p- l( m
如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。
9 x w8 h: T! S! \1 f- o5 N( Y
通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。
6 w. ^( F5 @: v
5.3.2 模型Ⅲ的求解
- ?4 s( S; E3 D$ P) f( i0 ~
对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,
2 a( ]8 O. F& U0 ?
将带入得,,即为2013年高校招生人数估计。
u1 {' h* B3 ?2 |4 I" r
对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,
+ p3 J; N# Y1 }! p, d
将带入,得到,即3年前的中学招生人数估计。
* F# I3 e8 V6 Z- o- F0 G6 E6 W/ m
利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,
: D+ p$ b# b+ O
将,带入得。
& v# [4 \! e# j
模型的评价与比较
: U# G, U% ~8 q; R: `* e- T
第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。
6 O- _, z4 n8 z5 K9 B( ~ |
第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。
6 s- M) @& P9 q
第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。
& L+ e* _% O$ A- w/ i8 A9 @* E: g
在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。
5 o" ?" x) a, l( m7 d/ C: a
但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。
7 G+ W. j4 A. A0 q$ c
参考文献
5 ]8 H/ d" k3 T+ P$ Y U
姜启源,数学建模,机械工业出版社,2005年
8 u" F) D$ r' P3 u8 k+ b$ P) p4 a
吴建国,数学建模案例精编,中国水利水电出版社,2005年
4 y. ^4 K( k) b* S' N8 [
附录
( j1 L: n5 l- S
8.1 模型Ⅰ程序
* k; i1 B1 ?1 R Q3 O; T+ T: {
x=1994:2009;
1 w: E" V1 }5 i/ G. |1 F
y=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];
& z9 E" n! D- O6 d$ q% s
A=polyfit(x,y,2);
( |3 K- d$ n- z! L& W7 L. \3 L
z=polyval(A,x);
$ w# }, r7 p2 x% ?5 `8 E% t# m% h' \
plot(x,y,'k+',x,z,'r') ;
6 X' h1 I$ T; y, {* c$ W
A*[2013^2 2013 1]'
0 J9 D! j, p `0 }8 [
ans =103.0261
) t8 L- C5 Q. W2 I/ D7 |5 m
9 [8 ?8 x7 _6 \: z) P
8.2 模型Ⅱ程序
6 U- `: [; |3 U- y5 L' D' D
t1=1991:2006;
: r6 l: r5 e+ e) P
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
2 g5 v5 p- k1 T3 T# Z1 N7 a2 S; D
plot(t1,x1,'*')
9 c+ V$ a! p, E6 f8 r
a=polyfit(t1,x1,2)
- L" W0 [9 u) U" z
* Z. F- h4 b& x3 @/ r
x1=[85.31 2.4862 125.17;
3 \' H" }+ e+ R6 Q* ~
96.87 3.2745 119.41;
$ k/ G+ f3 w; M/ ^* w- k' L
105.22 3.0211 112.21;
+ U% |. j6 ?9 e+ \* U
116.95 3.2972 115.88;
3 ~$ @' [8 o W
120.41 3.5714 123.8;
5 h, S( p6 Q O- z' u& Y" h% B+ p
118.61 3.4308 125.02;
8 p' t5 g4 i" q2 O. E8 ]' y/ i
115.14 3.5023 125.52;
* \& ]5 M- x! j
115.3 3.6067 125.17;
; p% e1 x" j1 M3 z" S0 {2 \0 j
115.58 5.7878 123.3;
6 u: W/ d& |, `' Q
115.88 5.7918 125.6;
8 W, F. b9 J* P
116.82 5.5036 129.17;
6 t8 P" E; t! s: m ]1 A' ]2 W
118.14 5.5611 132.87;
+ \% |1 n$ m, z6 n2 D4 H
122.97 5.6544 139.14;
2 _- }8 ~ V: F* n N- Z8 S1 x
141.95 5.6950 154.67;
; h' z* |, D9 ~
159.91 6.2994 167.06;
! E# T# R7 x0 k7 W, N
164.88 8.2410 169.69;
- y( q n4 H3 r& X: B! j. K
167.96 12.4817 178.19;
$ N" ~$ Y! Z+ X
188.59 18.3553 201.28;
3 q6 H5 {: V% s$ m# k; t8 R
205.62 21.8719 222.2;
' q& u( f5 `/ v: a
222.82 27.3894 234.18;
4 d7 e3 @; {2 g8 P
213.8 32.7452 220.94;
8 _$ p" J7 O2 ~8 u
207.29 40.0573 201.65;
7 q. G# m- P) y# v
196.7 44.5034 192.94;
5 ^3 _7 }" J; L. F- m
191.02 45.3479 192.32;
2 Q. [8 t, `7 K5 N
172.88 51.4176 179.71;
/ `8 R, P( c9 v5 @; i, s
158.65 50.1082 164.6;
4 h8 T! z% Z) X! Z: l& p
];
8 J/ @+ n7 A! i
x=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);
& K- s6 C3 R9 h( x. y8 I+ U4 E
[b,bint,r,rint,stats]=regress(y,x,0.05)
8 M x' Y( F* O. N9 A, q0 k
+ Q+ M2 [+ }" S0 Q1 E; D
8.3 模型Ⅲ程序
* _; z% ]$ w6 ^+ V- y' g# e
t1=1999:2009;
, r* B j. T1 ~2 e- J& ?
x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];
; F: L* @& d" g( G$ a; `$ V( C& V& e/ o
plot(t1,x1,'*')
) V$ x* Q; M( L2 R
a=polyfit(t1,x1,1)
: x! Z0 O9 p( w: f+ r& C
+ q: g7 M7 Q- J7 o
t1=1991:2006;
7 f1 Z# o3 u" n; S, B4 e. V
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
7 ^" B7 j }9 A& b( @3 N
plot(t1,x1,'*')
7 W% y2 {" F7 E
a=polyfit(t1,x1,2)
* @0 y5 j' K7 ?' M; N
作者:
775128646
时间:
2011-8-26 21:40
看看哈都
作者:
心馨
时间:
2011-8-27 08:39
论文啊、、、、、、、、、、
作者:
hgh158168
时间:
2011-8-30 21:17
数学教学对策的思考
作者:
wtdong
时间:
2011-9-1 10:10
作者:
fkusa
时间:
2011-11-21 18:03
真的很好啊
作者:
陈健康
时间:
2013-3-19 23:50
我使劲回复,就是为了看一眼论文啊
作者:
陈健康
时间:
2013-3-19 23:50
我使劲回复,就是为了看一眼论文啊
作者:
576683159
时间:
2013-9-1 09:22
建议利用概率,与灰色预测
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5