- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况
0 D3 _6 _2 v7 N摘要# g+ F# c1 c* p+ i- t
该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。
8 C1 G- ]1 T) R5 k/ ^ 我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。2 P# B* T5 G+ i m' i' |
结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。
) O( P1 V' o4 _' H% I4 y8 g 上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。0 ]* _( r$ x8 T- Y
, G) I/ e4 ?4 k; S o* u- J5 y$ N: s
5 m h8 c! i9 }% Q0 L
" `! H/ D. ~4 [+ m0 T; c - p- K! ?) Z* D& } c. \
1 e4 e% @+ F0 C: k0 b
" N6 G- F2 p; e6 M+ r6 @
6 H% z- z) U6 \) L ; f: z2 C% E. e+ x/ \
% s! s6 H& b3 @1 X. P
关键词:直接预测法 间接预测 模型改进 三种模型 误差分析
5 D& U1 A0 V3 W: K( y
" l3 y, |, h0 C# d; Q* x9 o
4 g+ _% C# _* q( y0 @- S2 S8 H$ W
8 v$ |4 U" E* P+ i2 {6 ?
+ Y5 y8 v4 ]5 X- V问题重述
# X6 R% |- n0 v- r( ?1 E) m4 Y; B 该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。& o! P9 y3 m# x' {& ]( b. M
问题分析# z: h3 Q# a! R7 L* |
要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。
' A2 `- k/ {8 I 对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。
2 Y4 J" I" ?" j; `模型的假设
0 c# M9 s1 I' p! v! R3 u表二所给数据为普通高中的数据。/ y! B5 G$ {$ L% M- T* C! ?
高中生源情况以高中毕业生人数来估计。
2 V% f$ i' ~) e! G+ E. {/ b R4 R定义及符号说明
; o0 r5 h0 }4 D; ?0 N:模型Ⅰ的时间变量;3 H- ?3 \' M) m# F# g& S
:模型Ⅱ的对于高校招生人数的时间变量;3 [/ `) }4 I" u# _
:模型Ⅱ的对于中学招生人数的时间变量;
7 t; H( r7 \9 @5 y6 X2 a# _:某一年高校招生人数;
" v1 H/ L# d1 `6 w+ [4 K5 y:某一年中学招生人数;* ?- Z6 e8 N! A8 a: Z
:某一年的中学毕业人数。
1 ~ w2 m0 h' K s+ j模型的建立及求解
5 b0 }' z5 G$ X0 K R7 N4 J4 o A5.1 模型Ⅰ的建立及求解
+ b+ q# D! L6 i1 [+ L, r 由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。' _3 M/ u8 s4 }
5.1.1 模型Ⅰ的建立
! |" R& k* I' v$ Q3 l2 |$ c 提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:
5 e7 [, d! a. K (图1)* k1 \" @# I; r# k7 @
由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。, U' i( M2 y/ \% S5 H
因此我们根据1994-2009的数据作图有:# a4 x- v& _8 }- T" J3 u
(图2)
l2 F6 f$ x0 Y h- q" A 对该数据进行二次多项式拟合:
e K+ Q) l' | (图3)+ R* C3 }& t( o" v( Y
5.1.2 模型Ⅰ的求解1 G1 L* E1 P+ f" _6 k5 N- q
拟合所得函数为:
) K" l& ^ b2 @ ;
* x r/ J1 R4 O& U, m7 W 带入,得到:。
& E+ e, P( C& i; z8 H' j+ O5.2 模型Ⅱ的建立及求解; B O/ i% O6 h
由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。3 Y: V+ F2 \; G; ?' m+ j
5.2.1 模型Ⅱ的建立8 z8 \$ w: F. H- C; s
提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:& W5 f1 S- J+ m' U- C M f# r
某年份的中学招生人数如下图所示: }: ^& Z6 j! Q% H4 U
(图4)
# H5 q9 @0 }3 u3 Y* A* ~$ C! l建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:
, a& b/ h, ~9 w: \- [9 ` i9 b(图5)
2 R4 s) }3 w) d模型Ⅱ的求解' I' q* N9 ^7 I9 r4 X0 |9 B
对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。
) g: |/ h3 V/ S对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;
9 ^- T4 h( j0 P" W) j: c将带入上式,得到:。
4 ] |- d$ A# K1 b2 V; d5.3 模型Ⅲ的建立及求解
. E. U2 I9 `" F/ A$ z2 P 由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。
3 z, ^. E5 W6 w9 z% F9 n5.3.1 模型Ⅲ的建立( x9 a+ H) o8 L
首先对给出各年份的高校招生人数趋势:7 |0 X+ h; m# g5 ?) Q
(图6)7 {* j8 P# n0 y2 i, g2 E
某年份的中学招生人数如下图所示:
/ Q7 D2 u0 ^3 N& ~6 U% G(图4)5 z8 g0 Y+ j+ y6 K( J( u1 n. ]; n
如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。+ _' B h! m! \! ]$ h. n
通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。
* ~# C! G- ^. D& y5.3.2 模型Ⅲ的求解
$ {: @" V# n4 T2 z- e对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,3 \1 F- M. Q. v4 Z0 j9 V! [
将带入得,,即为2013年高校招生人数估计。7 `4 n5 a9 q3 ^( s
对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,
& s8 S# @1 G6 X, J# C# m, _+ r 将带入,得到,即3年前的中学招生人数估计。
0 u# f6 y* s( K- b8 L利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,
; m E% x' {) L& v3 _8 B7 b2 {+ G0 A 将,带入得。
1 p: w% a% w0 L" l模型的评价与比较
* d x- M3 W: Q4 E# q# M+ `, Y9 L1 l 第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。7 N, E$ W1 ?" {# P+ \
第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。
8 V J; v, c" U 第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。, Z, ?* i/ _1 z5 C; g6 V9 i1 p
在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。
: R1 L# f/ j4 C 但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。9 x) v/ j4 R$ x8 u1 x; O
参考文献5 U. L& Q3 a- k
姜启源,数学建模,机械工业出版社,2005年9 o# H& W& T1 O) a
吴建国,数学建模案例精编,中国水利水电出版社,2005年
( P s& A6 J. F+ c2 X1 ~) ?$ z附录
4 [# D4 ?% N }$ C, Y0 A% ]8.1 模型Ⅰ程序. m+ G1 \" T# V6 U$ L' q/ \
x=1994:2009;5 D% v, F9 a% b* @0 m
y=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];
/ K5 ~6 ~) }) g5 V6 FA=polyfit(x,y,2);
) [% x. T8 @6 r* Az=polyval(A,x);
9 {; A4 E; o9 A7 }" \plot(x,y,'k+',x,z,'r') ;; C0 `8 a: t4 P. E* J* P
A*[2013^2 2013 1]'9 O# b. e f+ H5 l# e
ans =103.02617 f) U$ H/ ] L/ s
1 _ Z+ R5 t3 x# J: H6 Z0 D8 [2 |
8.2 模型Ⅱ程序 o) r, x1 @' F1 ^! ~0 a3 V
t1=1991:2006;, Y: W& @% m9 a$ K! n7 \+ |$ S5 B6 X. G
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
$ i s/ q( ~+ ]plot(t1,x1,'*')7 I% I: Y% C7 r E6 V2 k V
a=polyfit(t1,x1,2)( `: w7 \1 h5 i, s
5 K, ^6 ~, J O- Z h b/ G
x1=[85.31 2.4862 125.17;
* l6 D6 v8 n2 o96.87 3.2745 119.41;7 I0 N# O$ b, f2 p8 a3 J
105.22 3.0211 112.21;+ H" u+ H; C( z3 l" Z
116.95 3.2972 115.88;
& f* F! y: R. v! w120.41 3.5714 123.8;. g+ D* _. [, {" Q- |
118.61 3.4308 125.02;
+ E- i. `8 j: F1 w, O. ~' ^115.14 3.5023 125.52;
; F- a8 B8 i* M5 b, N115.3 3.6067 125.17;( Y% C3 x! G: B* c% `
115.58 5.7878 123.3;
+ F, q0 z A/ l# n3 u& w115.88 5.7918 125.6;
6 F& M* [! b: r' t$ _& x# b( w# P116.82 5.5036 129.17;; [* [$ K. L& Z
118.14 5.5611 132.87;6 H3 z% n) U5 i& \
122.97 5.6544 139.14;* C E5 T" u7 E# ^% @6 g
141.95 5.6950 154.67;
5 T. r8 e1 Y$ E) |, {% W! e) @159.91 6.2994 167.06;
8 F* [) ?2 z$ K$ k) a. D: h164.88 8.2410 169.69;" w* K4 I5 M) N/ g7 X) S
167.96 12.4817 178.19;. g. c- z. l4 O3 K
188.59 18.3553 201.28;
. o c4 `8 s K" ^6 [205.62 21.8719 222.2;
. k7 W3 y1 Y+ j! p+ r7 u# y222.82 27.3894 234.18;
9 i7 x/ `2 v* \# S/ e# p" w213.8 32.7452 220.94;4 ?6 v- m- S- Q n0 H a7 a0 r0 a
207.29 40.0573 201.65;. u' I" C/ a, C, i- O
196.7 44.5034 192.94;6 ?! k. f: i. F- G4 x
191.02 45.3479 192.32;+ ?+ o. S) y, J4 M- d; J, X O
172.88 51.4176 179.71;7 c( @( r9 h/ ^5 u# r% G/ L/ Q& D( W
158.65 50.1082 164.6; w3 s' P* W) {3 y! O# X1 w, k. m
];9 p: g; ?! l, v5 @; S! F, W
x=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);
8 i% I0 h# D6 {& X8 F& O[b,bint,r,rint,stats]=regress(y,x,0.05)
- w# q6 H% H/ l9 Y1 u+ Y' n- i8 L/ W+ T
8.3 模型Ⅲ程序% J8 i1 |0 f5 O, `
t1=1999:2009;& Q* W- T( C4 _% J
x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];' V0 [8 s9 K. y4 O8 [
plot(t1,x1,'*')
4 `! ?! q) `0 F8 I" z& s) N) Ya=polyfit(t1,x1,1)7 J; ~( I! l* W* i1 M
! O7 S$ M' }% Jt1=1991:2006;: f( f' U5 N2 x: u% _. d% Y( D, S
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
1 x+ H3 E# x n/ uplot(t1,x1,'*')
7 @+ D( [7 s8 ?4 n6 X% Ka=polyfit(t1,x1,2), h# w: P7 C8 m7 k
|
zan
|