- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
|---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况
/ ~5 e; x* D) L, E t摘要* C# E0 u9 c& [4 K) D
该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。
$ B' L; r5 k8 [ 我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。/ X' U w% R& A, @! W1 N
结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。
/ T% ]# l2 v8 T6 u! h3 t 上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。1 }. Y) l( L1 \$ B0 c% c# [
- x0 x' w. A4 }& I
( ~( ]9 c: ]7 e6 t
+ F4 r) n$ o' _& r& ] ) S/ C/ Z" Y: Z! O6 h+ _) C3 [
+ g% w( Q9 x% r. _0 z
* F* Z k( L S( `2 m4 o* r6 C" t/ Z0 S2 Z/ @
0 \3 O2 D( [" @: S+ ]3 e5 J
& t4 Y! a1 E% C' l# G- e
关键词:直接预测法 间接预测 模型改进 三种模型 误差分析' a5 m+ T5 f# }+ I# J5 S; J
# D/ g- }/ M$ V+ k" u 8 s+ y( H5 K. @% e
t* ~+ s0 i+ L
; G* E' G( m7 V9 @( E/ A问题重述
. d0 X% k( g" r9 J6 H7 T 该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。! K. D' H) _3 K
问题分析
- B, T" l1 T/ M6 Q3 {: c V' c 要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。# K2 v; ?2 `2 X0 a: K- X
对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。
" l- y( U- F1 m模型的假设
7 l9 x2 ]0 m! n, g& @8 R表二所给数据为普通高中的数据。
5 f( I% w0 O% E, H高中生源情况以高中毕业生人数来估计。- O: I: F7 B9 Y3 X# X& ?1 u
定义及符号说明
) | T% i, Q; c/ T8 \:模型Ⅰ的时间变量;
. K5 v3 l0 t0 ?. G# j:模型Ⅱ的对于高校招生人数的时间变量;
8 I( C3 d5 V. B% @:模型Ⅱ的对于中学招生人数的时间变量;
* p# C7 q+ _& _:某一年高校招生人数;
+ Z/ K6 S, e6 P9 U' k. K( d:某一年中学招生人数;
- s7 Z- p! a- [; [/ m:某一年的中学毕业人数。( `- T! L( P( C
模型的建立及求解 q0 k$ {/ J( R
5.1 模型Ⅰ的建立及求解
& q! B) C* W R ^/ z: b& R* [+ [ 由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。! F2 F7 c/ M; C, C2 G7 X
5.1.1 模型Ⅰ的建立
( t' V* W1 K. w3 e 提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:* B7 I0 O$ ~# k4 l+ d
(图1)
0 _/ t: T2 w* c$ H# Z' a3 ~) w 由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
1 _! ^$ ]# b* ] 因此我们根据1994-2009的数据作图有:$ r& r ?( H4 K( Q2 ?. N7 c9 O- q0 A
(图2)
9 |- J# @& A1 x& F' u 对该数据进行二次多项式拟合:7 A; i8 V9 `) c7 z& Z$ c
(图3)# G! l, {& B. f8 z1 B
5.1.2 模型Ⅰ的求解% S: r# E8 }; L/ z
拟合所得函数为:
; Y3 e' {- M1 b9 _& A6 b ;
) m& g8 o/ V& N( a# a' z 带入,得到:。
- i* d4 r) ?! w# Z& ^# h5.2 模型Ⅱ的建立及求解% \! j# U \* [( P6 i
由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。6 I$ `: v' x7 f3 L G: c" J
5.2.1 模型Ⅱ的建立
# b5 @- _ z* T+ a# F提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:
6 G! G0 [. l# l某年份的中学招生人数如下图所示:
2 I* ]0 E5 {$ R(图4)2 S6 W' n1 u7 [% u, [
建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:
5 Z1 C& M' o$ K$ o(图5): N* L; d+ B1 ]2 o9 F) q( d
模型Ⅱ的求解
$ x a5 S: c1 H! E对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。
$ x% o% w" E& T8 O. E" ~6 N对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;
- g( n* W9 |- Z2 V, N. j将带入上式,得到:。" _( e! S3 d; h* W
5.3 模型Ⅲ的建立及求解/ X4 ~) g% S; D, r
由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。& V& M, M! O% V
5.3.1 模型Ⅲ的建立7 v- F1 H H4 Y
首先对给出各年份的高校招生人数趋势:
6 C8 `; S8 q7 F- z8 W( x8 c8 Q7 q(图6)
" E/ M/ J& l( n. b& V某年份的中学招生人数如下图所示:
; n a% ]* `# N. a/ t(图4)7 u$ ?' n" M2 q! q1 k) L/ W
如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。
$ Q4 c b& S$ u. W% D, R 通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。
! U( r" Q0 d. b4 j6 `; `% q4 G5.3.2 模型Ⅲ的求解
1 E% X |; k- I3 `对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,9 T' ]# o) d" ^
将带入得,,即为2013年高校招生人数估计。
% X2 V/ B- Z& a+ i对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,
0 K7 a, |- C* E a: `( h 将带入,得到,即3年前的中学招生人数估计。
0 o V5 x, O6 X+ X& S利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,
/ R# D: n- k4 c% _' r 将,带入得。
, T, {5 \+ b/ }8 W' q, Q) j' E模型的评价与比较
7 \0 M7 \7 B1 e' B 第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。
! @: e( _! S$ ?0 V1 ` 第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。
0 Y& M) ~. \* V- S 第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。
; w& U% U! Z. A+ a' o 在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。
6 H! g& @- H4 i. u 但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。
# }: ~+ A/ l x: J5 _! h5 X参考文献
, Z/ l8 B3 w3 Z" j* l/ O' R9 D姜启源,数学建模,机械工业出版社,2005年, J" y* X, x) A& E7 K
吴建国,数学建模案例精编,中国水利水电出版社,2005年
: ^# y; _ Q8 f/ A附录- w# L! G6 O) v) P, q: \
8.1 模型Ⅰ程序
. _6 S) ?% u/ q: ^* F- D" I/ }x=1994:2009;' H/ Y0 c% I, V1 _6 Z: r
y=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];* I4 }5 ?% `3 U$ j, H9 c! S
A=polyfit(x,y,2);# p# c$ L- j% D& f
z=polyval(A,x);7 |# M+ T; t# [
plot(x,y,'k+',x,z,'r') ;2 I7 c5 }& o0 x! K, f7 G1 G
A*[2013^2 2013 1]'8 r' y" s8 H2 H ^/ y
ans =103.0261; }$ p* x8 R/ Z2 V
& C7 ^: M/ Z! k, s
8.2 模型Ⅱ程序& g' d' R6 h/ s& W
t1=1991:2006;
: X& n, g, k- r! u, gx1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];6 Q/ D5 S4 {% v- y* @& I" K
plot(t1,x1,'*')& W6 q0 G" ^8 `
a=polyfit(t1,x1,2), Y* F% d- e* C- f+ d* r
+ g \! C3 h6 Q5 i+ J
x1=[85.31 2.4862 125.17;4 I4 @" j: m; i
96.87 3.2745 119.41;
2 l. f8 g/ @6 G; }/ |# H105.22 3.0211 112.21;
* @" y8 \7 C+ D' _" q& ~! d116.95 3.2972 115.88;
4 k6 C+ ~& G/ H# R' |5 e120.41 3.5714 123.8;# }7 @4 M- X9 B. k* m5 D: ^
118.61 3.4308 125.02;4 W, M4 W5 G& G) U/ ^. b4 k* Q
115.14 3.5023 125.52;( d0 I0 v0 p8 U2 H& r1 [4 j p
115.3 3.6067 125.17;
I9 J4 P5 a/ |8 X" C115.58 5.7878 123.3;
. R1 [! S6 _6 p! }8 U/ W) W6 N115.88 5.7918 125.6;
3 X9 @+ l$ C; K1 o; z116.82 5.5036 129.17;0 D& I5 g3 K* n, w; \1 L; G
118.14 5.5611 132.87;3 x( H. Y3 \ U' Q. E
122.97 5.6544 139.14;1 U8 ~! C% A: ?6 L0 K) n
141.95 5.6950 154.67;
3 }4 F7 n. @1 P159.91 6.2994 167.06;
+ {7 e! j# {2 K* [4 u164.88 8.2410 169.69;) O7 X" i& W( W+ z4 V
167.96 12.4817 178.19;
" _5 b: f: E+ Z& e1 l% ~3 l188.59 18.3553 201.28;2 j7 s3 X6 H5 ^3 i. t8 b
205.62 21.8719 222.2;
+ A }+ K4 f, h6 B/ M) P# m, h3 N222.82 27.3894 234.18;
2 h! {( s$ d' S! z2 S% a0 i213.8 32.7452 220.94;
2 j- V$ S6 H3 y, [; D/ w6 n3 p207.29 40.0573 201.65;: I2 `. f! [+ ^8 q1 l
196.7 44.5034 192.94;+ ~3 Q% J% Z" o. a, I
191.02 45.3479 192.32;; \) f$ ~1 A0 E* o' M- d
172.88 51.4176 179.71;
6 l+ {5 W' m' |9 o! @158.65 50.1082 164.6;' P8 D) e6 m n7 [* D
];
. L% R" M3 S3 U. X+ d' f; [x=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);0 _: P6 Q5 r: \/ R1 {% u
[b,bint,r,rint,stats]=regress(y,x,0.05)
# Q. N& s4 I0 d J% o( _7 Q) `9 N
# y. Q) i/ P7 N) F* k1 l; U' g' M8.3 模型Ⅲ程序! Y0 z8 W3 P2 P
t1=1999:2009;9 |/ o/ @4 @7 I. L( }9 t1 }, R
x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];
; B+ [2 L5 R' b ]6 hplot(t1,x1,'*')4 O; b& c2 z' p( _ N/ ?
a=polyfit(t1,x1,1)* I* ~, o0 x; h/ x! Y2 [
' [4 ] P0 L7 I O4 ^
t1=1991:2006;& w. _0 K% a q: f
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];6 s$ T& x. U8 ]# y0 H
plot(t1,x1,'*')
: }& Z8 G# Q1 Ia=polyfit(t1,x1,2)
# f+ E7 O( g9 D |
zan
|