- 在线时间
- 14 小时
- 最后登录
- 2011-12-16
- 注册时间
- 2011-8-22
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 169 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 69
- 相册
- 0
- 日志
- 3
- 记录
- 2
- 帖子
- 35
- 主题
- 1
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   67.37% TA的每日心情 | 开心 2011-12-16 12:00 |
---|
签到天数: 10 天 [LV.3]偶尔看看II
 群组: 中国矿业大学数模培训 |
预测2013年山东省高考生源状况7 p* |1 T- Y) C; n {9 L: V; N
摘要
; }# M2 z7 h, Z 该问题给出三张表格,分别是历年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所给数据我们要预测2013年的高考生源状况。这对于实际情况很有指导意义。7 O% i. G4 ]# F5 x" d; ]! C
我们把高考生源状况用高考的毕业生人数指标来估计,故该问题转化成预测2013年的高考毕业生人数。在表2中,我们看到在校人数与招生人数约成3倍比例,故将表2当作高中的数据。* d/ n0 x6 G, d
结合实际,我们知道高考生源与高考毕业生数联系密切,但同时受到高校招生人数的影响。据此,我们给出三个模型:模型Ⅰ直接利用表2的时间及毕业人数的关系预测2013人数,在拟合过程中我们剔除了一些差异较大的数据,经整合,结果为103.0261百万;模型Ⅱ是先根据表2中的时间与招生人数的关系,预测2010年的招生人数,再找到招生人数与3年后的毕业人数的关系,据此可估计2013的毕业人数,得到90.5934百万;模型Ⅲ则是对模型Ⅱ的改进,将当年的高校招生人数考虑进去,我们可以得到招生人数及3年前高校招生人数对当年毕业生的影响权重,同时可以根据表1时间与招生人数的关系预测2013的招生人数,从而可得到2013的毕业人数,约为109.653百万。$ S' x$ ~2 V5 M" I# A' s
上述三个模型的结果差异在10%左右,由于实际中,高考生源情况受很多因素影响,因此以不同的数据指标来估计,存在误差是可能的,并且对于所用数据也是受很多因素影响的,这些数据本身存在误差,但是我们在现有数据下,不能消除误差。但是模型的建立还是合理的。" i1 |% }3 ]% a1 A4 ?4 _, `
7 p/ r) G! t, m
* i$ \1 Y) L6 K9 V( P# T
+ h5 V0 w u0 j$ S + m8 f3 U! ^ X
& }2 C8 s5 G0 V; j: n- }
5 C3 E/ k* g4 v
+ K, o! j9 f! F G" u2 \9 C - F' [7 o6 t, |& S# P
- d K. x1 p+ ? 关键词:直接预测法 间接预测 模型改进 三种模型 误差分析+ r' e* ^# A7 }5 }8 k: h- B) S
6 c( y! R# O" X- `1 l 6 O6 L' L; `% d9 s; C
: ^! H& I- G4 S6 T# S$ F1 J+ q
1 V$ b) ^/ a! j/ |* g" M6 h
问题重述
$ @( \8 d/ y( q+ b' { 该问题给出了三张表,分别是1981—2009年普通高等教育、普通中学、小学的学校数,招生数,毕业生数,在校学生数。根据所提供数据,运用三种方法预测2013年高考生源状况。
8 I3 b( m* t. Q/ W, _0 I" V/ @+ r问题分析( @& u" v+ u$ X* h0 h+ x
要求预测2013年高考生源状况,而在所给数据中,给出的指标为学校数,招生数,毕业生数,在校学生数,其中高中的毕业生数应该相对更接近生源的实际情况,而普通高校的招生人数也与当年的生源有关系。从不同的角度出发,我们可以用不同的方法来预测2013的高考生源状况。
4 f# @* L. Q" v 对于所给数据,我们注意到在表二中,在校学校人数约为每年招生人数的三倍,据此估计该表为高中生源情况表。
( E2 T/ }: h+ ?模型的假设$ i @" h- v7 f' ~9 h
表二所给数据为普通高中的数据。8 k! ]9 G* D' T/ |3 z) I& \( w: G! _
高中生源情况以高中毕业生人数来估计。. P2 @6 R8 Y$ W/ U
定义及符号说明& e3 z9 J' L; X3 B
:模型Ⅰ的时间变量;
( q; y+ n: }8 ` `' K( U:模型Ⅱ的对于高校招生人数的时间变量;
* U0 v W! a0 F8 D) \4 ]1 z:模型Ⅱ的对于中学招生人数的时间变量;% y. D$ Q0 d/ V8 w2 q Z
:某一年高校招生人数;% N# }; d) w$ h# }4 J2 H1 @
:某一年中学招生人数;
7 r4 |0 s8 @2 q/ k: ^2 e:某一年的中学毕业人数。1 I& v, T$ b5 W: L, m+ ^6 |- P
模型的建立及求解
5 I2 P( Z- k4 D# M" T% g5.1 模型Ⅰ的建立及求解
1 M* S& g) N8 [; I- m0 K M @ x 由于高考的生源状况与当年的高中毕业生人数息息相关,因此我们可以利用表2来拟合函数,直接预测2013年高考生源情况。! E* [; G) b+ m0 m* v
5.1.1 模型Ⅰ的建立
F j" }) g7 Q2 X2 S Q+ m 提取表2中年份及毕业数两组数据,用Matlab进行拟合,作图得:& P7 d. _; z( A( b
(图1)3 k7 I( ]+ W! O( m
由图像,以1994年为间隔点,之前的图像与之后的图像有很大不同,结合之前的国家政策等方面,如果预测2013年的情况,用1994年之后的数据拟合准确率较高。
- T$ ~( L1 A6 x+ O ? 因此我们根据1994-2009的数据作图有:9 Y9 R) l( H d. {
(图2)4 e' Q" f' w+ p% M$ N
对该数据进行二次多项式拟合:; y: C9 D k# V$ a/ w
(图3)* z6 m& `! C# l) N
5.1.2 模型Ⅰ的求解
" ? d4 H1 E* I4 h; S, i' P$ K 拟合所得函数为:
: e' x: {+ z* C. e2 ~; N; ^* B ;
7 D( ^4 t" r/ |& c* c 带入,得到:。$ l/ U! ^# N) J+ Z R7 A7 [
5.2 模型Ⅱ的建立及求解: F3 d+ b. r! d
由于高考的生源状况与3年前的高中招生人数相关,因此我们可以利用表2给的招生人数来拟合函数,预测2013年高考生源情况。, h- z4 V( y8 W- i$ F
5.2.1 模型Ⅱ的建立+ c0 \$ z o$ r+ L& E, W/ ]
提取表2中年份及招生数两组数据,用Matlab进行拟合,作图得:8 x7 U- g, J, s. a7 Q
某年份的中学招生人数如下图所示:7 r$ _8 m$ z- s, r0 y# ?. z
(图4)
5 f9 ~5 W& F( b& o& y4 S建立3年前的高中招生人数与当年的高中毕业人数的关系,用Matlab作图得到:0 ?3 t$ a& f, S
(图5)
$ q6 k6 E9 y9 q5 y模型Ⅱ的求解$ o2 ]# g, B& K2 i N8 }4 n
对于2010年中学招生人数的估计,我们Matlab拟合一个二次多项式函数为:,将带入,得到,即3年前的中学招生人数估计。
: P1 m0 T& r6 B对于2013年的中学毕业人数与3年前的招生人数的关系式,我们用Matlab拟合一个一次线性关系式函数为:;8 I5 F% G6 K" {- K
将带入上式,得到:。3 D4 H( o4 A! ~* \
5.3 模型Ⅲ的建立及求解5 P( M C0 ^3 ^- S4 w
由于某一年生源不仅与3年前的中学招生数有关,与当年高校招生人数也有一定关系,故可以把生源看成是两者作用的结果,利用多元线性回归分析得到一个拟合函数,进而估计数据。: i; ]; T0 m. G3 u
5.3.1 模型Ⅲ的建立
. m3 r' ?5 L* I% s: Q3 ?. c2 I 首先对给出各年份的高校招生人数趋势:
- e2 F9 n5 O8 s$ N8 h+ g(图6)
7 X$ a" h0 E) K1 H- ^) h某年份的中学招生人数如下图所示:
- J* u. H& [, Z" K% ~5 r, Y(图4)" y0 M. w* p2 B9 g
如模型Ⅰ所述,我们要忽略之前的一些数据,在此模型中,我们不妨取1999—2009年的数据,利用多项式拟合先估计2013年的高校招生人数及2010年的中学招生人数。, s$ W# O/ _2 ^# z- Y. N
通过数据估计出生源状况与高校招生人数及3年前的中学招生人数的多元回归方程,带入前面所估计数值,就得到2013年的预测生源情况。
' I# ?* f4 {; j5 M0 F5 K: X" Y) J$ m5.3.2 模型Ⅲ的求解) J3 K, U8 z$ B; a/ ?$ x7 u8 M
对于高校招生人数的估计,我们用Matlab拟合一个线性函数表示式:,+ P2 l0 P8 l8 f9 L. c( \. x5 D9 S
将带入得,,即为2013年高校招生人数估计。* W/ E8 I) K9 @" ]4 v
对于2010年中学招生人数的估计,我们们Matlab拟合一个二次多项式函数为:,
6 Z, O$ L' f4 Y! i6 R4 O- c 将带入,得到,即3年前的中学招生人数估计。* @5 f# N2 E4 p$ W
利用数据,给出高校招生及3年前中学招生人数对当年生源状况的回归分析,,
: _0 z8 Q& \) L& Z( u& H* I 将,带入得。
2 s, c8 a# w" J$ W模型的评价与比较9 l9 }. n) I" n: l
第一种模型中,利用中学毕业人数直接估计生源数,考虑因素唯一,毕业人数和生源之间存在误差,加上数据本身的误差,其结果与实际结果存在误差,但误差不能完全消除。# ^* j% O- U# @) k
第二种模型中,先估计中学招生人数,进而找到招生人数与毕业人数的关系,由此来估计中学的毕业人数,这种方法有一定参考价值,并不直接预测,结果与第一种模型差很多,因为该过程中多次运用有误差的数据,因此结果会有差异。& S3 ^9 J! F7 _% y0 P3 b0 M; U8 y
第三种模型则是第二种模型的优化,考虑到了高校的招生人数,增加了影响因素,根据所给数据预测二者对生源的影响权重,使数据的运用更加合理。
. Z# P9 _5 z4 |3 a! U 在上述模型中,均对一些数据进行了处理,如剔除了一些数据,因为受**因素及其他因素的影响,前几年的数据趋势不足以说明现在的生源变化情况。因此为了使结果更准确,我们可以利用近10年左右的数据。
6 Q3 ~8 g, z3 R V0 U; V0 T 但是由于我们把生源情况当作高中毕业人数来估计,这其中是存在误差的,加之处理数据时也存在误差,故我们的模型仅能给出一种预测方法,如果是数据更加合理,我们还应考虑其他一些因素,进一步优化模型。
. P. E. S5 m! r) U参考文献7 C* ]: I4 f- j
姜启源,数学建模,机械工业出版社,2005年6 j6 y- I: Y8 W; W
吴建国,数学建模案例精编,中国水利水电出版社,2005年
* `" d# U/ \; ^$ K) x附录& s; j: y4 _( c: a! _, _$ ~ Q
8.1 模型Ⅰ程序" o2 H, D+ s: {3 J; Z$ `
x=1994:2009;
4 q( d4 Z' n! k A5 N2 `, Uy=[116.82 118.14 122.97 141.95 159.91 164.88 167.96 188.59 205.62 222.82 213.8 207.29 196.7 191.02 172.88 158.65];
3 Q" N6 {; G N1 O) n$ F4 OA=polyfit(x,y,2);
" K5 G0 Z. h! V; b# k+ S- qz=polyval(A,x);
' T+ H' M$ i1 k6 [plot(x,y,'k+',x,z,'r') ;
8 M7 r' O }+ \+ g+ `" BA*[2013^2 2013 1]'
$ u2 B O" g1 k, cans =103.0261
, x; Z0 B9 ]$ c6 Y$ M; f7 a
: H. n! X& ?4 S5 A8.2 模型Ⅱ程序
* S, Q# T x, Y" Wt1=1991:2006;+ N- l& n: Q/ s# I$ h, g0 @
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];' h' x/ o/ o% K( _7 {0 v; L p( A$ A
plot(t1,x1,'*')
& y3 T* |1 z7 O# i/ N% F( X4 ?a=polyfit(t1,x1,2)
; I5 j; g' u+ }- t7 C: }+ H " C0 j' G2 R& P( F, a, I7 |
x1=[85.31 2.4862 125.17;
: h% d9 x+ R: o8 }# s9 [96.87 3.2745 119.41;
6 q$ _1 N0 G# r- f. N: `105.22 3.0211 112.21;
/ \7 N6 j1 z8 C2 C+ l116.95 3.2972 115.88;4 J+ s U% r5 D6 z5 D% H+ q
120.41 3.5714 123.8;
( h- o$ I0 y# J; _ I. q118.61 3.4308 125.02;
- _& ?5 k* k7 A7 A115.14 3.5023 125.52;
0 f* j) n0 @7 v7 @7 \+ e w115.3 3.6067 125.17;
4 I2 o; t6 r' b/ K9 q d115.58 5.7878 123.3;
. @- F, P5 M; z7 p/ v% Z115.88 5.7918 125.6;
! r- H, c4 c5 B& V; p116.82 5.5036 129.17;$ {8 X) l0 j4 H0 W
118.14 5.5611 132.87;6 y! J- P# [3 w" z. [. T
122.97 5.6544 139.14;
0 `" o4 D1 C- ~6 a' ^141.95 5.6950 154.67;& A5 C3 A: m; o) w9 o; ?5 W1 Q2 |
159.91 6.2994 167.06;
- r( ]! {$ _4 W; Z164.88 8.2410 169.69;
2 R t+ d( Q: n2 s167.96 12.4817 178.19;( P9 o7 W- o: [; N; V
188.59 18.3553 201.28;; N7 u# O3 [! }4 h) O" v; Y& C/ d
205.62 21.8719 222.2;
! e! W- g" s# h4 m5 W3 n; }222.82 27.3894 234.18;
% Z0 e+ M: d" [9 B, _6 z; p213.8 32.7452 220.94;
1 v- {3 t" G! {3 U3 r. P207.29 40.0573 201.65;
7 H7 @9 `6 p, H) |. Q% i: @2 L9 p7 c196.7 44.5034 192.94;( S- ?# d; B* H- P" s
191.02 45.3479 192.32;4 v# l7 A- H. ]) m7 u; f
172.88 51.4176 179.71;" L/ ]. O5 `5 G5 ?$ f+ J
158.65 50.1082 164.6;$ }) W" w8 \% k) A9 e2 {( I2 c
];
" o5 I# e5 y+ e& |x=[ones(size(x1(:,1))),x1(:,2:3)];y=x1(:,1);! C" d! I5 i3 c: A
[b,bint,r,rint,stats]=regress(y,x,0.05)
' Z+ m$ ^, Y- j" [+ V+ j
# b$ r ^8 Y- t! s" u8.3 模型Ⅲ程序) ?! T6 r: c/ Y7 e" V. ^
t1=1999:2009;
- {3 b' A! Y8 K S# V" r! ux1=[8.241 12.4817 18.3553 21.8719 27.3894 32.7452 40.0573 44.5034 45.3479 51.4176 50.1082];# b- f8 j. Y: D. c2 G7 w3 ?
plot(t1,x1,'*'): p& B7 {* D( k( N% c2 I+ r
a=polyfit(t1,x1,1)
) t1 I) a5 a! ]4 ^ ( q) @4 [+ t' R
t1=1991:2006;9 _; l0 ^! p# n) o' d' N
x1=[129.17 132.87 139.14 154.67 167.06 169.69 178.19 201.28 222.2 234.18 220.94 201.65 192.94 192.32 179.71 164.6];3 D& E' k; U0 I7 ^3 c+ k+ t
plot(t1,x1,'*'); s4 D2 k4 O- h" T4 U* m9 x
a=polyfit(t1,x1,2)
0 h- w/ a$ `( o. E: o3 i7 k |
zan
|