- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
|---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况
7 L! `, S( b+ z摘要
7 e- [: z9 r9 H6 x) d1 w 该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。
5 k& e! J* G1 s# f 我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。
5 j1 e+ w' F/ I& ~6 Z 结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。
/ n/ ^0 Z3 h' _5 e 上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。& Z; `# v; z7 U: f
- T+ K8 t1 V' E, u) h* F; B
3 Z1 }. e$ O5 h7 y, c, f " f! c0 |8 [( E$ X6 F( Q/ L
2 M8 i* W& ~, K; _# v . d2 y7 d0 f1 e6 O) Y# [
, d8 f+ R: P, D% J6 q: J! Y7 Q
, X9 B1 C& }$ g( {" t
8 I1 B5 |. e6 o' J
* O. i# o5 L$ `# g' S, T& W 关键词:直接预测法 间接预测 模型改进 三种模型 误差分析) r$ \& l& ]2 j
' Z, _% d9 [5 V8 a; X3 J) S0 B ' f0 j( W7 L2 ~: F3 q6 Q+ E
1 |4 Y, M4 F9 V( x3 Q: f' _
- Y! W7 M* }" _# v# d" V问题重述
+ k/ s4 y8 z$ n* P, P" {* D4 \ 该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。: J1 P0 s: \3 x0 A
问题分析
9 I0 G5 w; j' C7 v+ i/ L: ]! h+ q G 要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。
4 ]0 K2 U0 r+ ]9 j( z 对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。
, {% j4 c f( U/ h0 P模型的假设
9 J9 s2 n' _3 b* b! l8 N) z. a表二所给数据为普通高中的数据。
( W; W$ S/ w- e0 `高中生源情况以高中毕业生人数来估计。" X2 O, ]4 i5 i2 C! }( o& L9 I
定义及符号说明
6 I4 b# j; n K9 b7 Y$ w8 q:模型Ⅰ的时间变量;; @) Q1 y' H/ h8 G& L
:模型Ⅱ的对于高校招生人数的时间变量;
0 B. L, N5 V/ N8 v' N8 k:模型Ⅱ的对于中学招生人数的时间变量;
9 W7 ~ D5 j; L5 W:某一年高校招生人数;( \7 X" Y, G+ i R/ b2 s
:某一年中学招生人数;1 r; t: N# Z# V* j8 ?& z1 ~1 v
:某一年的中学毕业人数。1 P: v- f% x- E! i# M
模型的建立及求解% J- p( v, X$ }; M8 H
5.1 模型Ⅰ的建立及求解/ i9 X& V7 d& I5 z$ @
由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。9 g- f! P& ? W. H3 X
5.1.1 模型Ⅰ的建立$ I4 J" ?6 R3 c+ h& a
提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:
2 S! x5 o; b: z' K8 L2 Z7 r (图1)3 y* d4 K. O c% Z9 N
由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
6 j/ _0 p3 D, b% B 因此我们根据1994-2009的数据作图有:0 w7 I g$ v0 ]9 Y% j
(图2)
+ {/ ~2 G9 Y' U; ~ 对该数据进行二次多项式拟合:! G+ k- T4 q5 @5 t A) e% W3 ^
(图3)
: k/ Q2 m5 _0 {2 r& c# q5.1.2 模型Ⅰ的求解# h$ Y& {" M- J
拟合所得函数为:2 T4 i; K+ q/ _. s, w
;# Q, G0 { t: |
带入,得到:。
! @% _! y- Y) r6 T7 U5.2 模型Ⅱ的建立及求解% e D4 K0 {( P3 a% F& s2 W
由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。4 @; K+ {% a D. n3 o
5.2.1 模型Ⅱ的建立
4 m3 }, L% ]1 [提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:
* C5 ~6 c+ Q: P- s. R( l5 p某年份的中学招生人数如下图所示:
( O( I% p) f$ k# d(图4)
5 c6 F- ~( f/ R" t/ Z建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:
7 o a t& @9 ~* N(图5)& c5 ~) V( x2 W6 J8 o* d- n# f
模型Ⅱ的求解0 K; \+ [- R3 |! f2 S
对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。5 Q5 L# D5 r# I2 s+ e8 E. u
对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;
' J9 N( l: e; M将带入上式,得到:。' o1 \8 G5 L, z, }! `
5.3 模型Ⅲ的建立及求解
: r2 U6 t( S. a4 a 由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。
& C4 E9 v$ O. D+ L( V% Z& a- {, F" f5.3.1 模型Ⅲ的建立
* L! }6 V- @: c0 Y3 }5 ^7 O. Y% d 首先对给出各年份的高校招生人数趋势:
' O) `6 j8 G: a' {# \: p(图6)' k6 t( W* t2 `$ B- ?* E; }. t
某年份的中学招生人数如下图所示: @9 \/ u* r9 }8 e5 I8 W
(图4)5 i% K: ^8 |7 h
如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。% G# c/ I: S6 [
通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。5 _2 w! x4 ^, w; O
5.3.2 模型Ⅲ的求解
0 m/ x) r/ r) Z6 X5 d3 @对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,
8 N. l( Q# R5 G- n3 w" f 将带入得,,即为2013年高校招生人数估计。3 G' L: U% ]" |& ^8 V* ^! ^- a; a
对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,
& c) u1 J( B) K6 j 将带入,得到,即3年前的中学招生人数估计。6 q- }: _- J$ N
利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,/ G4 T& p8 f0 ^" c! }. Q; r
将,带入得。
8 z' q* V2 T8 g3 l Q' n t模型的评价与比较
; m6 X7 p% n d1 [# N! v 第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。6 x! M. @4 \' R, m
第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。8 |5 W# L5 Y' p5 i0 M2 o7 m4 W: Q; U# e
第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。
4 {0 ]3 x2 k& y& l+ t 在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。) e/ S2 Z! j/ K
但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。6 I. m( v* t2 ]
参考文献
7 r: g" e4 a+ n8 A& O2 G: J1 Z姜启源,数学建模,机械工业出版社,2005年
( ~, X' b" {6 F! k吴建国,数学建模案例精编,中国水利水电出版社,2005年
3 w4 C3 u* y6 C4 J5 y! Y; R: `& s附录& n0 ^: F4 H, d. b4 `# I2 H
8.1 模型Ⅰ程序
7 u9 ]& s* m: } Cx=1994:2009;" L1 A8 m* X& ~
y=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65]; k6 _; ~/ Y& K
A=polyfit(x,y,2);1 ^- I+ N& W' T1 O a' o
z=polyval(A,x);% G8 ]9 s" x* X+ M6 \; F3 r
plot(x,y,'k+',x,z,'r') ;8 g8 P1 ~- u6 a. j; o
A*[2013^2 2013 1]'1 u2 p% ^, c! {( r
ans =103.0261" v/ y0 W$ ?2 p9 H2 B4 p5 ]! l7 C
" v0 h; X5 C' f8.2 模型Ⅱ程序
% L- U! K9 K4 x6 i7 X6 at1=1991:2006;; O: u+ [. w. o. h" q2 H% A: w
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];5 m0 X N! P' B# t1 \, j! ~2 E
plot(t1,x1,'*')
/ @2 k, f3 B* }! G& w6 D9 fa=polyfit(t1,x1,2)$ m' [; N( D/ J. T1 u$ V
7 C0 d3 `% c4 w# v$ o9 ]
x1=[85.31 2.4862 125.17;( i1 \( c) V: J5 W
96.87 3.2745 119.41;
5 y$ X' w) s2 i9 ^; U; x- s105.22 3.0211 112.21;
* h* k3 A4 Y& }8 p/ f9 }3 h116.95 3.2972 115.88;' ]! S0 q8 I) {/ t+ S6 K0 S
120.41 3.5714 123.8;$ P& e, D+ I# I
118.61 3.4308 125.02;
- K4 t8 n6 u5 G" E115.14 3.5023 125.52;# K P; Q3 {+ v& {0 N$ K! @7 R
115.3 3.6067 125.17;: Q# h+ _4 m: z# k9 y
115.58 5.7878 123.3;
- W6 ^* p2 c; P0 X- G# a115.88 5.7918 125.6;$ X6 A5 d1 @* _2 B9 ?! W6 \/ w
116.82 5.5036 129.17;8 A8 R5 P7 t" i$ T" I+ A
118.14 5.5611 132.87;
7 A% G+ s9 u7 o: K. n122.97 5.6544 139.14;
! j5 }1 S" i5 A- p141.95 5.6950 154.67;- T9 g; u) X, N$ B/ a# w
159.91 6.2994 167.06;" @0 @/ w; b O% m8 @* {6 X' E
164.88 8.2410 169.69;
* f; e+ o' u& X6 @: E c5 Q# ]/ h167.96 12.4817 178.19;
; ^' L7 G, u) D. P188.59 18.3553 201.28;
5 \: v) Z6 p( ~205.62 21.8719 222.2;1 s: q1 c, ^5 ]' g! B( t% j
222.82 27.3894 234.18;
2 h" Q% \0 g1 n* b213.8 32.7452 220.94;% O6 }2 O& ~( h. q
207.29 40.0573 201.65;0 _+ f: u6 D% ?! e1 \( X& ]1 R
196.7 44.5034 192.94;
9 x. L+ N M) M) K; v7 r4 @) x5 s* a191.02 45.3479 192.32;: ?& j' z$ _3 w
172.88 51.4176 179.71;/ G& B+ a( C' ?7 X
158.65 50.1082 164.6;
# P8 ~$ e' E' f6 l) W+ _! I];
: W4 B" L$ s" _x=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);5 w' n) O3 p4 m, Q$ M% y2 j: O
[b,bint,r,rint,stats]=regress(y,x,0.05)
2 M, k/ Q8 H7 D+ \+ O* f) r
8 i0 y% e7 |; X9 T$ N# e# N& t8 \8.3 模型Ⅲ程序3 h# z) Z# b8 q1 X0 c
t1=1999:2009;
4 t5 W3 X/ w& z J1 ox1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];. n; z6 K; N: P9 h
plot(t1,x1,'*')- W8 V9 _5 P% D, X. y: o! G
a=polyfit(t1,x1,1), o$ q6 n# @8 J8 Y8 ?6 d
, X5 n& O. A: b7 z$ Xt1=1991:2006;; k8 B+ a- N+ n( G5 J. \
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];- }! C% |3 |* ~9 H* H1 Q. S
plot(t1,x1,'*')) @6 B- i& ^7 M1 A, R
a=polyfit(t1,x1,2)
. f+ X6 z- Y8 z2 [. D' E L |
zan
|