- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
|---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况3 }. L4 u! h7 B# i
摘要
* N5 @2 w' [1 P3 i' a& l 该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。
4 C5 q( c, Q8 f& J 我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。
U. J: d i5 i' w X0 Y 结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。4 z, a7 h1 D J* ^0 k" s1 I
上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。
+ y* O- [! k/ w- U; g0 O! o0 E' f. \1 {
+ B @. D8 d+ y
- v5 {2 W, G. c9 A# e 6 R1 c6 |4 B& a3 R
; f* q. m$ E( s% I/ T 4 w0 w3 U6 D+ m: U
1 V7 S+ b8 f0 o
& u5 o4 E' M [
5 o6 W& e5 Y' V/ t - `: G" [, q2 H" z* `8 D) m# U0 }
关键词:直接预测法 间接预测 模型改进 三种模型 误差分析
. p6 n% V# U7 m, G+ w/ V+ i. s 0 l! i0 \; o3 U
+ u( z0 y' f K# N! j3 S- v
1 f6 X" U1 H" w6 J* b1 ?
! K8 ?1 F+ o2 L, ?问题重述
0 x$ V r3 ^* Q 该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。) A' Y5 v3 {/ O: q9 n$ ^& C' |
问题分析
( l3 f9 Z2 t' x' u8 X5 R, c2 C5 P, s# _ 要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。
3 ^) c L* q1 k7 y- B 对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。8 p+ X; W9 S3 K( \9 n
模型的假设
, o! }& k' S6 A8 w: n表二所给数据为普通高中的数据。* s) p) K! h4 Z: L0 U6 _% t# R
高中生源情况以高中毕业生人数来估计。
& A: Q! o& F( w; \定义及符号说明# l5 t& s8 e" A) j! O) B# c
:模型Ⅰ的时间变量;! P; X5 z( F! i8 e8 a0 f& |' _
:模型Ⅱ的对于高校招生人数的时间变量;
N. T( X& J. o0 w9 s:模型Ⅱ的对于中学招生人数的时间变量;: I) T. i; H$ Z+ u# k
:某一年高校招生人数;
; l7 I0 k% E; M/ T2 U: o8 s:某一年中学招生人数;2 v4 o" d( y2 Q' h
:某一年的中学毕业人数。
; U& o4 A" U0 M) R4 `# L模型的建立及求解
- [/ y# R5 x7 i' ~) q8 Y5.1 模型Ⅰ的建立及求解
. {- j2 j' H1 U: x 由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。
8 s! `% c2 K9 s9 m- F5.1.1 模型Ⅰ的建立
1 f5 g4 U; }# S) }( H 提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:0 w/ G* j9 [; B! k0 p- n1 R: t0 T5 U8 X
(图1)/ a6 N6 x0 E" K. ] l
由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。2 o. k, i z# }) N9 a# @* S
因此我们根据1994-2009的数据作图有:" f1 \9 D& U1 C: D/ `( I4 M! {
(图2)6 T( D* R4 R4 b3 Q, g6 x
对该数据进行二次多项式拟合:3 p; ]& d% _4 A3 S* ]9 o
(图3)9 `% M" S" o! I9 W
5.1.2 模型Ⅰ的求解4 C6 ]/ T' d( U; Z% F
拟合所得函数为:
1 Y7 w9 a. I8 s5 }& a/ D4 a ;
7 O4 Q+ b+ N) k w 带入,得到:。7 d4 } \. T" s
5.2 模型Ⅱ的建立及求解
" o/ V' A: i& Y- P7 _8 v$ ] 由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。
; t* |( ^4 k. `8 }2 _5.2.1 模型Ⅱ的建立9 g2 O5 z! s5 n5 x1 q" b/ x8 F
提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:
: G/ e$ C; V/ X g1 |% O2 [某年份的中学招生人数如下图所示:
; s% i1 k5 D& t(图4)5 I: U5 N' y& y' E4 C) H5 F( N
建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:' K/ W( n u- B9 e- O
(图5)9 b' Z$ r' U O. [! f; Y
模型Ⅱ的求解
1 {; o3 j T9 l对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。
8 J/ i! o! e+ v$ L8 J对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;: J/ V3 `( D9 T$ g, t0 s2 j" Z
将带入上式,得到:。
6 R* P8 G: u% _, H z5.3 模型Ⅲ的建立及求解1 C9 I' ?0 l) e* p
由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。8 n3 ?1 R4 {- m, D
5.3.1 模型Ⅲ的建立
/ T9 Y& I% Y. x# S( F" R 首先对给出各年份的高校招生人数趋势:
$ z4 |" A( V. x; R/ m(图6)% Q( N: ~) g) w3 r; Z
某年份的中学招生人数如下图所示: Q( D: Z4 T7 [2 y1 N
(图4)
% p: l3 J" V9 V5 {$ _7 D) m& c 如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。
+ k* r8 I: h3 j, K+ D$ n 通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。$ E8 h$ u9 V+ q5 x8 Y
5.3.2 模型Ⅲ的求解
t L6 q+ ?, q7 T$ l对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,& j! c" f5 C, g: Q/ O( y
将带入得,,即为2013年高校招生人数估计。
7 B$ p' E8 C2 o9 ]6 U2 C对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,
/ `. x5 d7 M2 d+ W& u7 y* H! M 将带入,得到,即3年前的中学招生人数估计。5 C. Y& S4 r2 r0 ^" M# v* I" h, D
利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,
* W' V* N% V! u+ N% M# `& w 将,带入得。
7 B/ g1 R) e1 D; s7 z. f1 v模型的评价与比较
3 y8 `% W% i9 } |5 ~ 第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。/ {0 y; a! v# |) j
第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。
7 z, \" x/ }8 g/ ?9 I8 o 第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。
7 w. l* r% h" ?5 s 在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。) k: s9 B5 q2 C
但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。
5 q1 |9 C8 R, V9 o# P( U参考文献
; h# P: p x: B/ M4 W姜启源,数学建模,机械工业出版社,2005年- `' H8 \' w" C& ~
吴建国,数学建模案例精编,中国水利水电出版社,2005年1 Z- s. h8 Y" q0 Q% o1 k
附录: d' y4 H! A8 J6 i
8.1 模型Ⅰ程序( t$ R; C6 w4 r! N) A
x=1994:2009;
4 d( V, w7 q. fy=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];
5 Z: P8 i* X" P& ]4 n& X8 RA=polyfit(x,y,2);1 n; O U R8 m
z=polyval(A,x);2 _- J! K) ~, U0 S' ^( j
plot(x,y,'k+',x,z,'r') ;
( Z) A/ S6 I" C* k h, qA*[2013^2 2013 1]' y$ f( U5 z/ q/ O4 G
ans =103.0261
# t; c6 ]& X% J/ Q2 q* h2 J
3 c6 P; m5 `- e- W1 n- r8.2 模型Ⅱ程序. ?) l! D$ t* x1 U. f/ C
t1=1991:2006;
4 n* Q: O6 D5 S( F8 i' v2 ix1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];5 j" H# }2 \! B: C
plot(t1,x1,'*')% T* D! k& z& o6 r: ^5 ?9 ]% d
a=polyfit(t1,x1,2)
+ o: m( y4 s2 Y; j: O3 d; Y
# A9 ^5 X+ f2 z1 ]1 kx1=[85.31 2.4862 125.17;
* z; R9 r) e# ^* x2 F6 t96.87 3.2745 119.41;6 t- a) M2 R5 X( G) B. L- a
105.22 3.0211 112.21;
) {- X) i$ m1 d- J116.95 3.2972 115.88;
! J' u8 p- @! b120.41 3.5714 123.8;
' R2 F4 `9 [2 e& M9 j/ Y118.61 3.4308 125.02;
% C1 k; B% O3 I6 b115.14 3.5023 125.52;
+ {! X W1 Z# R4 b115.3 3.6067 125.17;
k' b: Y- v4 J- D4 l# K4 [115.58 5.7878 123.3;: U0 t3 @ k' \
115.88 5.7918 125.6;" ]+ R4 w# U1 T9 y4 J% K: a; Z
116.82 5.5036 129.17;* ?5 r! p8 v/ B0 O! o7 w1 E
118.14 5.5611 132.87;8 R" w, D9 J9 m8 W) k* |
122.97 5.6544 139.14;
6 ^+ V$ r* Z) I1 j* H7 x4 I6 T141.95 5.6950 154.67;7 l! K$ U+ v/ u! \- a8 S _ Q
159.91 6.2994 167.06;
2 G2 D- P( L$ M8 k164.88 8.2410 169.69;
) ^1 U9 i! C: o167.96 12.4817 178.19;
' _' n! F3 O; x9 n5 _8 B) t188.59 18.3553 201.28;
( o, L2 @6 O8 D" O S- t4 O205.62 21.8719 222.2;1 S5 L" |. W; y" l6 G: b B/ W) F% I& ?( }
222.82 27.3894 234.18;
+ `9 u. x4 z4 { V9 A213.8 32.7452 220.94;
7 j3 V* |/ L; z( B1 e: C9 f207.29 40.0573 201.65;( D3 a3 y( H8 C+ W# Q
196.7 44.5034 192.94;- I1 [5 f2 C z$ z1 a
191.02 45.3479 192.32;
) R) e! G, }# f9 S; r172.88 51.4176 179.71;) G5 \$ _1 c; Z
158.65 50.1082 164.6;
5 U& D8 y7 h/ D' q];
$ J$ P. q1 K; f# t6 W# d7 e2 Tx=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);
9 U8 w: l1 t9 n; C[b,bint,r,rint,stats]=regress(y,x,0.05)0 K" g! v, }, {3 P5 S6 a# d0 }
/ d% u& B4 o1 d" M+ L
8.3 模型Ⅲ程序
) m( Z X% D+ @2 [t1=1999:2009;% k% Z& t2 |, |
x1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];
: ^9 g/ `3 h) V; f7 e: _$ cplot(t1,x1,'*'); Y0 V0 M K" Z0 @3 q, _/ L
a=polyfit(t1,x1,1)
W, `, T* Q5 k2 N8 `
* ^# r6 t) Y8 c; A: {% K. F% W9 ~t1=1991:2006;
7 Y: |! z. H# Z. b) W" u, yx1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
# |" z# e4 h. E [7 Mplot(t1,x1,'*'); k, R, I ~6 o0 ~7 |
a=polyfit(t1,x1,2)1 q1 k' I3 n+ X8 y+ h/ e
|
zan
|