- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况
$ ?; z9 T. B# d" w摘要
8 c: O9 b) B" b9 b d 该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。( K! y4 [+ e( u' {1 M3 ^# Y: a
我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。' [. v" R4 u- F/ j
结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。+ c* A8 _- [. F$ E* m% |! C- m
上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。2 w |/ x8 u* `/ f; d1 y
. u3 l# Q5 h5 A9 o& i
: S$ n) B* J9 \" @" _ ( Z9 \; |% N1 E/ [9 [; K
8 d9 }% ?8 ~6 c: a
8 R( Z* l9 W7 ^( U' b
/ m6 t: w( V; [2 t" ^) m
' v! m2 e5 n- d1 }8 d+ ^$ }
8 v5 B8 `) v$ u - o2 C* O( z' `$ d' Q
关键词:直接预测法 间接预测 模型改进 三种模型 误差分析
7 t. D2 g$ J4 v: @ % ]6 z9 L: H# r1 |
?4 \# R I9 _9 E* C
: s( V( W1 w" u- x7 v
* c1 c7 P6 y$ v, l+ \; q. H1 a* H/ |问题重述
( Y5 `6 t( K7 F/ f* A7 P 该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。
4 L$ O% G/ E, T问题分析
9 Y4 ~; G! C" t9 H3 h/ u9 { 要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。& s8 g( G& x! d' @3 O- V- N1 E8 z
对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。
9 a( ]$ v- u7 N' c9 q模型的假设
. z7 T, s" E( Y7 H4 k7 G$ c) t表二所给数据为普通高中的数据。
$ p P9 P$ c! o" l* |高中生源情况以高中毕业生人数来估计。
! m6 H* |* x" D5 r定义及符号说明 [& W+ D% c3 y( L
:模型Ⅰ的时间变量;
9 W% `$ q# r }: M9 [- G7 Q:模型Ⅱ的对于高校招生人数的时间变量;' p( g; k: K3 S+ }! S% {
:模型Ⅱ的对于中学招生人数的时间变量;
0 Z2 X! [ ~, }9 J) r:某一年高校招生人数;* a# J9 I! t$ ] W: j. w& A
:某一年中学招生人数;
! {; L% z q6 d1 [( a% j:某一年的中学毕业人数。8 _3 |" V/ N" Q5 l1 i' |
模型的建立及求解 t' U1 I+ ?/ m$ k2 A7 I$ _* i
5.1 模型Ⅰ的建立及求解
3 p% ^5 a' w5 E5 A* x) b( X" O6 x 由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。. e* O2 u- \% }9 `
5.1.1 模型Ⅰ的建立
; b+ L, ^; d( f( L 提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:% h- l' T! ]: D8 y1 ~% G
(图1)
5 d7 x; e- y( ?! O! S 由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。& w5 P& M S/ t* U e' [% Z& H" R$ I
因此我们根据1994-2009的数据作图有:
* l# q) {& _" v% W9 k, @5 b/ k/ C5 i (图2)
9 F% R$ h* \0 M' F 对该数据进行二次多项式拟合:
5 x2 f0 w8 ?* a; E: d K2 R5 z2 T (图3)
5 k' I7 B x. I4 j# w2 A1 N5.1.2 模型Ⅰ的求解" z/ S- |: l4 |" i
拟合所得函数为:
9 ~, @1 D7 u) y, o ;. _, j }4 k& J" P2 i/ ]8 K$ x
带入,得到:。) n- }# g* L' }; H& R$ _! T
5.2 模型Ⅱ的建立及求解
. Y4 Q! ?6 q2 u, _- E 由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。( ^3 w6 j. z' E( b/ c
5.2.1 模型Ⅱ的建立8 `. X& W! f4 F) c4 n! b7 u
提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:
4 g8 _( B+ b- Z8 `某年份的中学招生人数如下图所示:# Y& n0 n5 q6 K! }! N6 i+ C- o
(图4)
% q& L1 k% k' F% E' F% c0 ^建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:
2 ]/ b& e2 ]& l$ \ s- h' [(图5)
4 m9 u2 |( ]; f/ ^. X9 W模型Ⅱ的求解6 t/ f9 G1 Q* G- @- N
对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。
/ u2 v( ?1 g# |4 O对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;' Z6 B0 z9 @# W9 {
将带入上式,得到:。/ ]- u! E( [7 |2 ~$ K
5.3 模型Ⅲ的建立及求解5 X$ P+ a0 A% J8 O
由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。 A- @' O1 x9 f
5.3.1 模型Ⅲ的建立
4 g2 F# F, ^( g5 E; Y 首先对给出各年份的高校招生人数趋势:- r: j4 M1 x* s! ^
(图6)6 F0 R( d* A/ r5 F: a2 o7 t
某年份的中学招生人数如下图所示:4 P" R3 a; K6 l, I: ?
(图4)- U" X( k. S4 x, j5 l# I2 g
如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。
) G" S1 d C E3 K 通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。3 [8 { ]# h) A: l8 D9 k
5.3.2 模型Ⅲ的求解
1 x* I6 h9 ?; n T对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,
% e; z/ \$ Q2 [0 k1 W 将带入得,,即为2013年高校招生人数估计。4 U1 L+ H8 }% Y/ ~ [% Q
对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,
_) ]8 p$ {: ~' m, U 将带入,得到,即3年前的中学招生人数估计。 M$ a# ^7 a" l3 I( A- H
利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,. Y, C( G9 I7 o% m
将,带入得。
5 T* E5 [. {% B模型的评价与比较
5 X# _* N1 P/ |0 k 第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。0 v5 L2 |- G+ g" {5 W
第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。
+ a+ }6 ^# ~( s7 ]) C: H0 [ 第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。' Q% r# o A3 a# ~# _
在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。5 a) x+ w* }: [. ^; S' r+ M& k7 K
但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。9 F L, H; j4 L' q' s2 z7 G `" ^
参考文献# ?/ l6 R2 L5 M3 w; J) p
姜启源,数学建模,机械工业出版社,2005年2 i$ ^0 g* p6 J0 f8 V+ N$ b" w+ R: U
吴建国,数学建模案例精编,中国水利水电出版社,2005年
* H; l+ K0 L, r8 {* Y附录* x1 {3 K4 g& \0 `* w# g/ v& |, z
8.1 模型Ⅰ程序: [& {5 C1 j6 _
x=1994:2009;
' W4 ?$ ]. @8 t/ L+ k) Hy=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];! N) q% O- M9 ~2 ?; f2 O7 n
A=polyfit(x,y,2);
# d% W" N( @9 |! H5 Jz=polyval(A,x);
* j" r6 I8 D( N! J- Eplot(x,y,'k+',x,z,'r') ;
1 w4 u+ M5 X h1 M. U4 GA*[2013^2 2013 1]' t: ^+ V* i$ e7 f" F0 {
ans =103.0261
5 E4 ~5 u4 c8 o* f* A& {" @5 F0 U# m3 @2 o* X
8.2 模型Ⅱ程序6 ?+ g( w& {. y' P. K0 t
t1=1991:2006;& G7 [; k1 H2 ^' _3 u$ ]
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
\0 m1 B: K2 ?) d: ~) aplot(t1,x1,'*')
- _# ?( g, T. Y" p* ^6 ma=polyfit(t1,x1,2)
; X. Q) P" z9 @5 f* @ 8 Z- Z/ ?6 k2 ]0 n$ |0 \
x1=[85.31 2.4862 125.17;
0 I0 g) _/ k% L! b) {96.87 3.2745 119.41;1 h9 q* J$ m& Y% ?! a/ h4 @
105.22 3.0211 112.21;, c) J L+ K2 ?# M0 e, }& W
116.95 3.2972 115.88;
8 |, |; ~3 A' P$ ?5 K, E$ q120.41 3.5714 123.8;6 S* l3 j) J p: W( i
118.61 3.4308 125.02;. l6 R: v4 F6 a. Y/ Q
115.14 3.5023 125.52;
' U P6 ` D7 i9 i8 ]8 g115.3 3.6067 125.17;
7 b5 ?2 z) g3 z4 u115.58 5.7878 123.3;* z5 b9 {+ S. k' b% X2 y. ^0 X
115.88 5.7918 125.6;
$ n) n+ c. p5 h8 J116.82 5.5036 129.17;! _0 ]/ N+ f8 L" f' I% p8 m
118.14 5.5611 132.87;
# t0 v+ _* F7 v122.97 5.6544 139.14;
& R, j! u) a6 k141.95 5.6950 154.67;
/ d" F3 {9 Y) J1 U* @& D159.91 6.2994 167.06;3 e+ J( ~& f6 K4 H
164.88 8.2410 169.69;
M# E6 B# c/ O; r; M% }; d$ _167.96 12.4817 178.19;; m+ T4 c( n1 W }+ A+ |. A
188.59 18.3553 201.28;* O3 J* \3 F& Y/ L8 y3 Y+ `
205.62 21.8719 222.2;
7 b7 V! Y1 b2 @: m/ e) `& Y222.82 27.3894 234.18;" [- L/ G/ y- Z* S
213.8 32.7452 220.94;- T0 J! F) r t* G
207.29 40.0573 201.65;# l' |' {9 o, M: @* B- j
196.7 44.5034 192.94;
' D$ @) ^: ]1 x2 l5 D" _/ s# }$ ?191.02 45.3479 192.32;9 r$ t; S' J& r$ t5 F4 \
172.88 51.4176 179.71;& l4 {; q. W9 t9 _
158.65 50.1082 164.6;
" c0 U; f1 L6 b' `/ Y];8 o& g) p3 Q' a4 S( g
x=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);
+ h+ l9 `* a& W9 x) O[b,bint,r,rint,stats]=regress(y,x,0.05)/ y G, y4 F# V/ f6 l! m
& W( W# A' Z/ P) S5 b
8.3 模型Ⅲ程序, ^5 u5 g" y" L: u5 x7 O
t1=1999:2009;
+ y/ V4 _+ O: z3 [8 w8 u& F( wx1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];" b! e# x+ B+ C& {! ^/ K ~3 O
plot(t1,x1,'*')
/ d$ E/ k0 ]$ ?& o, a8 q4 q5 b# `a=polyfit(t1,x1,1)
$ m7 s% d1 [7 {+ I2 E $ W7 H P, W+ Q1 W' y
t1=1991:2006;
$ W G) U- O* i( ^. d; _! _! }' vx1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];* \0 H* i) ^9 g& L) a- a
plot(t1,x1,'*')
6 r8 @" ?/ k* l$ U7 i3 ma=polyfit(t1,x1,2)2 q5 |. V3 J9 z
|
zan
|