- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况# ^# R5 I y+ L6 ^. S
摘要, s$ B- T; E) u# N
该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。
F! `! v- {4 z( z 我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。
4 a+ I/ ]% m$ w6 ]% T7 e 结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。2 A4 b! D1 a/ h8 }5 M/ e; w
上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。
6 |( M# w1 a% n; t r# z( G # ^, w) r- t( b3 t
' W! B, w0 L/ \, K. M5 E
' r; B: q: T( j2 C ^
H2 r; D; q0 d% }5 A 9 ^2 f3 R: I7 h( t8 v9 o
4 t( _1 Q/ F+ e6 Z( ^% M5 z. Q- Z- Y+ M0 W
# w+ U# t; Y& |8 ]% L( z5 X
|) \6 h. ]- u3 F8 O 关键词:直接预测法 间接预测 模型改进 三种模型 误差分析! }1 ~3 T3 X' O* s
; } R1 {# q5 B6 n5 q: q
5 U q! a8 q; J/ W8 A. P
& f! A8 z! d8 i. [8 q
1 T# Z9 y1 x& }" c' }问题重述" A: _1 O8 O( M" ^# C
该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。
! E1 [" I9 ]7 h3 q问题分析1 Y- v8 @4 b' n; \# B, `
要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。, {! F+ r$ l# y' E
对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。
, ^0 ?; K# Z: B3 {2 G模型的假设
' o; h" K- a# ^$ @0 C表二所给数据为普通高中的数据。
; s8 Y) [" E1 A- I高中生源情况以高中毕业生人数来估计。
; d/ z/ m+ }4 g- Y# k定义及符号说明0 }7 M/ F; X# X4 ]; p9 u5 g5 m* k
:模型Ⅰ的时间变量;/ s1 L" G4 t9 y; N* `+ `/ P! C0 p
:模型Ⅱ的对于高校招生人数的时间变量;3 {! {3 X, p: i L! B# ~1 G
:模型Ⅱ的对于中学招生人数的时间变量;3 _1 ]$ j' ?- U0 ]
:某一年高校招生人数;
) f; L: {/ l1 \: E6 l5 U( [; _:某一年中学招生人数;
+ a4 `, v9 R9 e5 B6 D:某一年的中学毕业人数。( B- v; g5 K3 d+ |
模型的建立及求解
) U2 X! n4 B: K0 Z# W. T: ^1 o3 W; n5.1 模型Ⅰ的建立及求解
* X& @: _$ D1 B- {9 M* s% V 由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。
# x& {! h/ Q Y9 x& o+ v [5.1.1 模型Ⅰ的建立
. d4 Q1 i# g& z$ H 提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:
1 \+ v8 q, F9 @ (图1)$ F' V3 j; }% @5 x |# n# I6 Y2 a
由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
5 ^" T' b; b4 Y' M: C" G 因此我们根据1994-2009的数据作图有:/ R' ` r3 o6 [+ d
(图2)
* \1 j) X5 u: G" k. D2 ] 对该数据进行二次多项式拟合:' D0 ?, w. @; o+ t0 U4 g7 m
(图3). I) g, ?0 N X( m
5.1.2 模型Ⅰ的求解
! L. Z3 N# W- D 拟合所得函数为:
' ?/ n& A- P; u: d: g0 ` ;
$ D g; d3 z: f8 K' i% J 带入,得到:。
/ ~. {7 e A0 W5 m+ I5.2 模型Ⅱ的建立及求解
: d' S. E2 [0 K4 ?6 @7 ?' M 由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。
f+ ^$ \: Y8 z" V& a& x5.2.1 模型Ⅱ的建立
0 l: x* o+ X( n8 _ s提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:
& L( T- E! \8 i( `某年份的中学招生人数如下图所示:
- v" M, n& U5 |$ m5 k(图4)% T- p* _. g0 Q% j t% b& G# v
建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:3 c8 m* }: H e* k; `- O0 A
(图5)
, y$ i% t& i7 W A7 x/ \模型Ⅱ的求解! H, T; W4 I6 ?. R% L$ x8 }2 R
对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。
3 [, ^& A7 M' ?对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;8 ]5 w7 u2 s% _ B
将带入上式,得到:。
% r: a, m M1 K" `$ R5.3 模型Ⅲ的建立及求解+ R6 \8 A; s9 X8 n/ ~2 A
由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。
5 U; K1 t, g1 I+ a3 X5.3.1 模型Ⅲ的建立$ S, r9 }% G5 r; y8 \; _! D
首先对给出各年份的高校招生人数趋势:( n# r, s& }& |0 Z0 ?7 d+ c
(图6)
# g/ W! r( l0 o T4 Z: v某年份的中学招生人数如下图所示:
6 I. w3 }) i. F& X" j# z6 a(图4)+ W4 Y( ~% T6 s& w+ W5 X
如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。
1 U. a4 O0 V( B6 Q: }" W) j 通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。4 `7 R/ m( M7 o
5.3.2 模型Ⅲ的求解# G2 z+ d }8 @ V, V
对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,3 z4 d2 W, r& A L+ m
将带入得,,即为2013年高校招生人数估计。
, r* X" x& {! h" Y1 P8 T- w, ~0 e对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,
# m* g( H0 z I 将带入,得到,即3年前的中学招生人数估计。. w6 A' J/ `) \. v* x# g( S
利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,& b" D, K7 s B2 j" t! ~4 w
将,带入得。
) ?# X5 [5 O5 i% r模型的评价与比较
) R/ U; K J+ W. l, s* P 第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。% I) V. t! M+ R: m1 K7 B: N
第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。$ k# H- S( d% C
第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。% O: g+ F+ \, E* |; B! z0 y( n
在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。5 F3 Q3 ]7 B" X& l! c5 o6 ]2 q# E
但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。( d* e) Z6 l- S) H0 G, x
参考文献$ [- p. Z9 i$ s3 p, O
姜启源,数学建模,机械工业出版社,2005年
$ L* {3 q6 D5 D- T! z6 ?; U- f吴建国,数学建模案例精编,中国水利水电出版社,2005年0 `) p9 m3 Y1 d( Y' v
附录
4 |$ m" _& |; A* ?- U5 W; L1 x: i; r8.1 模型Ⅰ程序
2 h% G1 o. z4 w3 ~5 S9 U% Yx=1994:2009;6 E1 R1 k7 X9 H3 m+ B# N
y=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];
$ a5 k6 v5 h: a" R' G+ X) P5 FA=polyfit(x,y,2);
3 ]& q" U% O+ i/ Fz=polyval(A,x);
+ u0 E6 ]$ q9 x% Uplot(x,y,'k+',x,z,'r') ;" A, [6 e4 G) R0 V M
A*[2013^2 2013 1]'
# }! V; I5 B* A0 gans =103.0261
. |- Y8 h' b. d4 V0 M9 D; E9 E7 s! m7 Z! e$ \* P
8.2 模型Ⅱ程序
, T% a- a8 s3 `8 [t1=1991:2006;
1 A8 `$ a4 U0 h8 {5 J* Ox1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];
/ Y& a! B" k) Z {8 @9 {/ i! w) gplot(t1,x1,'*')
, A9 W2 U+ s3 v- ?a=polyfit(t1,x1,2)4 n- b% ~2 A1 a: M% q
, @2 w' \! W9 x7 K: ^$ p+ c: I7 H
x1=[85.31 2.4862 125.17;) V- ?. L# E M: K2 t) X! J' C0 S% }
96.87 3.2745 119.41;
2 H0 o( n/ N! k7 ^& @8 Q105.22 3.0211 112.21;0 b$ G6 E" @$ @7 b m; V
116.95 3.2972 115.88;. k# }: w9 ~ `8 F9 ?+ u/ {
120.41 3.5714 123.8;6 a+ U1 G# A0 }% i+ h. R/ \
118.61 3.4308 125.02;
( g1 T2 }8 l) F, s9 C8 G8 K: }, n115.14 3.5023 125.52;8 V7 y* c. q* k f. }, a" a
115.3 3.6067 125.17;0 y8 L1 z" \! P4 p& K
115.58 5.7878 123.3;' G O+ B2 X9 A
115.88 5.7918 125.6;- k! ^% j8 }' N
116.82 5.5036 129.17;; l% u5 P1 R# C: G% a- G. Q" I
118.14 5.5611 132.87;3 C/ v3 D1 v. F2 P( B0 o7 ~
122.97 5.6544 139.14;& _6 `) e" {/ M
141.95 5.6950 154.67;- ~, O1 I6 Z4 B" n0 Q
159.91 6.2994 167.06;
- S. l+ L* G* f+ E1 Y) }- D: D8 |164.88 8.2410 169.69;
. C/ B$ j* A' k167.96 12.4817 178.19;5 K ?; e4 K' u. Z# _* _1 O& @# X9 B
188.59 18.3553 201.28;
6 C9 o0 }, b, A& l205.62 21.8719 222.2;
% ]4 V) b* B4 `5 C222.82 27.3894 234.18;
% W6 _5 D- |! b. i9 k& a+ C: R8 Q213.8 32.7452 220.94;
: @0 V- d6 B! |( d207.29 40.0573 201.65;
5 u% T6 z6 @6 B3 S3 E+ o u# [196.7 44.5034 192.94;
% l/ D0 p# Y. g6 R% [# `191.02 45.3479 192.32;6 m5 L: X+ ?9 _4 U$ z E+ v
172.88 51.4176 179.71;
6 u6 z7 Z( X% G4 f& a" y158.65 50.1082 164.6;
0 ~. A4 u( J* C];
7 E( F: E9 X" M: A5 Ix=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);/ Z8 n* i/ I6 u. u) m
[b,bint,r,rint,stats]=regress(y,x,0.05)- W# M$ s N9 N- I
% f* b6 \+ g3 T/ h, w% {) q1 @8.3 模型Ⅲ程序
1 ?" R0 Z9 X# Z4 t2 [t1=1999:2009;
Z) f- L+ `( H, `, T7 Px1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];
( Z8 Q9 G+ Z* E9 Z0 z V8 S D5 oplot(t1,x1,'*')/ i7 c4 l3 ]) G
a=polyfit(t1,x1,1)
$ U1 z( Z: f m, J0 \. J ) F9 ~9 z& K9 ]0 |3 y
t1=1991:2006;/ }9 ]& L, b7 [$ n7 g
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];6 W7 i( N. ^) A, I2 C
plot(t1,x1,'*')/ X/ L4 b6 N! u5 f _9 g6 ] y
a=polyfit(t1,x1,2)$ l, y) q0 W% S: M+ }" m/ J6 v$ t
|
zan
|