|
第十届华为杯全国研究生数学建模竞赛--第四轮模型建立 3 I7 `" [+ P% G F2 v
: ]9 Q* m4 c; E0 j D- ?8 J O
' K* V0 w9 P P* v
第十届华为杯全国研究生数学建模竞赛 --第四轮解析之模型建立与求解 ' W' G/ s5 g6 P t" B
4 f, u4 [0 [2 R* a) s; v
3.1 问题一模型建立与求解 ) S) U& ?( [. m3 p: W
3.1.1 新洛伦兹模型构建 4 t* ~9 U ^$ q. A- C
假设基于统计分布表示的收入分配的密度函数是 f ( x),其中 x 表示收入,对应的分布函数为 F ( x),则 p = F ( x)表示收入低于或等于x的人口比例。记收入低于或等于 x 的人口群体拥有收入占总收入的比例为L(p),则应有 $ I' q$ P' `3 W5 E2 S
1 x L ( p )=mò0 tf (t ) dt , p = F ( x) file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml9080\wps1.png
* b. ]' P7 I. _0 n6 O: aL ( p)称之为收入分配的洛伦兹曲线。收入分配的洛伦兹曲线 L ( p)在收入分配分析中具有重要地位,它表示人口份额等于 p 的低收入端拥有的总收入份额,因此 L ( p)是定义于[0,1]区间上的函数。按经济意义,它应满足如下条件:
3 @, ?. { V. E5 mL(0,t)=0, L(1,t)=1, L¢( p,t)30, L¢¢( p,t)30
: Y# p2 w" W, I即 L( p,t)在[0,1]上是凸增函数。
$ t7 a2 W8 n+ I) i9 S" A在分析与测算洛伦兹曲线的实际工作中,在只有分组数据可用的条件下,可以先估计收入分配的密度函数,从而得到相应的洛伦兹曲线,或直接估算洛伦兹曲线。国内外学者所提出的模型可以概括为三大类:几何计算法、分布函数法和曲线拟合法。几何分析法,是根据分组数据刻画洛伦兹曲线,利用这一方法不能得到洛伦兹曲线的表达式,只能用来计算基尼系数,但由于在计算分块面积时用直线近似地代替曲线,所估计的基尼系数要小于实际值,尤其在数据点较少时,误差较大;分布函数法,是基于对指标的概率密度函数或概率分布函数的假设,估计其分布参数,然后对洛伦兹曲线进行估计,这类方法较为复杂,同时由于计算收入分配的概率密度的复杂性,很难提出合适的概率函数;曲线拟合法首先假设收入分配服从某一特殊的统计分布函数形式,如对数正态分布、伽马分布、贝塔分布、帕累托分布、威布尔分布等,再据此为洛伦兹曲线选择适当的参数方程直接进行拟合、确定参数,由此估计出洛伦兹曲线。 9 H8 D4 \' B0 h- D' w) w9 t# g& S
为了更准确地描述洛伦兹曲线和精确地估计基尼系数,本文通过分析洛伦兹曲线的特性,构建新的洛伦兹曲线模型,对洛伦兹曲线直接进行拟合。根据洛伦兹曲线应满足的性质入手,在查找相关文献的基础上,总结前人所做研究,构建 出满足洛伦兹曲线的新模型 L ( p,t ) 。 Chotikapanich(1993)提出较早的洛伦兹模型: $ a. }) L2 T8 D- L
6 3 ~% s8 i4 N% @4 R3 I$ M- b
3 N) E9 O9 R3 z" K
6 p* x/ }0 j' l' c
| | |
# l. m) q$ f0 X' ]2 p
| |
9 E& J' k- `* p
|
1 I- J* W& f7 s/ J! n7 H
| | | 2 X6 g0 M! s" u5 r6 r% \
|
) o# M1 t2 j! z- dSarabia 等提出了基于经典帕累托分布的洛伦兹模型,其基本形式为: / ?+ |" m I, u" g; z
L ( p ) [size=10.5000pt]= 1 [size=10.5000pt]- (1 [size=10.5000pt]- p) b , b [size=10.5000pt]Î[0,1] | | 6 L, z9 b! ]. @0 @: I( _
|
% ?8 G5 ^: v/ l2 h* s4 j5 U* N
|
8 ^5 Z3 h. F( J' @) ~/ U* ^: ^
|
5 f* e: V/ j8 u5 g5 R从(1)式出发,他们有提出了一族广义帕累托族的洛伦兹曲线模型,具体形式为:
( _: |7 }5 o0 Y1 D, i: V9 }L ( p )= pa(1-(1- p)b),a30,bÎ(0,1] |
% @# t p( z& V& b7 z# `; q& n
| 4 J% S; r( [9 K( h: B+ R3 s
| | 2 v' K3 r& ^& `
| 9 f4 ]7 k* h% M. T6 r5 l
|
7 @1 p3 x+ y, v
|
1 q/ i( m* b, g6 r
|
* r. e; q* T: n. M
|
* N. y7 e- f3 G+ O* A8 f. F! l# r
| 0 ~9 z6 J! C4 H, N+ k
|
! {8 q y0 s7 ~( K/ P+ s% J h7 u
| " `" E, M! t! O, s
|
) |4 |7 O1 N% O; I; S* V: N2 x
| $ ?- A7 M6 V2 b" l
|
2 Y& G3 b3 b* [( y4 F# i' F/ f6 E
|
~% `# _ J; e
| L ( p )= pa(1-(1- p)b)n,bÎ(0,1] |
% Y3 n$ ? v( L& ]# H. ]# f
| 3 d4 C3 K. u' o
|
1 e% W6 M- e" A8 \
| |
% V- c1 F/ k! m
| L ( p )=(1-(1- p)b)n,bÎ(0,1] | 6 ]1 v" |( h" }! i6 A$ F
| ; N+ ~. x0 y9 ^, N ~5 ]& Y
|
9 t" ]4 a$ f4 g B& ]+ @
| | * S0 r' |7 J" g. K# l
| 7 w" W. o7 m8 S4 a# Y( g$ a) d
| ( {* t2 a/ \/ o$ ^, U
| : K" ]; `( F; L( d% v) |$ g
|
3 ~% s4 F8 p( y. H
|
. H5 ^0 c& o$ L+ T
| " t c' o- |8 j F5 m9 B/ r
|
) ~+ E) m% i! G- h2 p5 T! M' [
|
$ J7 t, R# B" n8 b* `/ R
|
8 l' |( w; U% z: q8 q
|
) j- E |( q7 m D
|
) j/ \% o8 w2 N
| 4 i' u) ^) ^! x6 ?5 y
| |
% r9 c- p; j: W9 D7 K8 l" {! h
|
6 W& o) c" {8 u% J
| 4 ^' F6 a6 O# S# J( E
|
$ w) K, W. D0 y# k! ^% Q6 C( K
| ! R/ H! b- U7 p1 [: ?# b6 U
| ! d5 ^- Y$ x3 N7 c$ x! j4 t
| | | | , b Î (0,1], l Î ( -¥, 0) è (0, ln b | |
' G! D: f M, e; S* e1 ~
|
0 R! i2 \3 m- d- w' ?$ }5 H; X) e
|
. b4 h- F& l. x5 L- S
| ; {6 f V2 |, Y6 ?& \; s
| 0 A3 s; T' G; ^5 _" v9 R
| | 8 a1 S0 l1 X2 o! _6 f
| |
4 f4 x5 b7 ]1 H6 _8 D
| ) b4 w! `% ^9 Z: q) f6 D
| ; a' F( a1 ?# j5 z1 S+ |& L' U
| 3 D" o2 z# s5 |) n- @8 _; L8 I M
|
) p( j/ U2 c( a2 d8 a- S" Q7 B
| + c2 `; d1 ~( D% l
|
2 ~( r) h6 _3 i
| |
3 a' e+ F) b5 Z5 Y
|
2 u3 [, N1 P9 d/ ~5 Z) u" [ j
|
4 L* M# C! ~$ b) K
| | | " Z& Z( |" O9 A$ k7 U7 \
|
1 C9 W% N0 L7 b- N- W
| 1 m/ r* [+ j& o) k+ J; _0 U
| | 1 [ ]9 N8 ^! S; S
|
3 w! R% N$ m; D5 R1 S" s* T
| / ? W5 _+ m& A* v
| ( y# [2 r: ^" f6 r& J
| 5 f- D7 h8 Z3 ^' y
| $ k9 @4 n, q, k7 ^" Z# Q' }* @
| ( p& [0 b) Y9 _/ G
| |
) ?+ F8 U% ?4 U
|
+ o% a* M3 I { q. K
| * {( V- q: C/ ]6 P9 ~/ N
| | | | | ) s2 i% h5 \7 Q! k: I
|
: E2 F) e* I' ^$ }$ t
| | ( v$ M: l6 C" A2 ]2 q
|
i t& F+ x' X5 _
|
0 T. M" z. e* f7 B: D: o: T- q
| " |7 n; T; ~* M) m( m7 i
|
, D8 W' x; L; D4 v. B& v, @) B
|
8 A8 I3 S0 ? \( Y; j7 O, H3 o4 M
| | + ^% j% r4 L7 [( ?+ J
| | 4 q5 L& a, u1 A a
| . ^" e' P+ } {' R& r/ R u
|
- B: M l6 ^# N6 w5 l
| | ' ?- r+ ~& g4 x' }8 W' q# y! [8 Z5 q, u4 F
|
$ ^+ h8 Z2 i) G: @9 ~3 xOgwang 和 Rao(2000)曾提出用两种混合的方法建立洛伦兹模型:加权积(weighted product)及洛伦兹模型的凸组合(convex combination)。并且得到凸组合模型(8)满足洛伦兹曲线性质:
8 r$ w$ h. J' q5 e; Q- b | ; _4 N5 F9 [- D
|
3 O- W! a8 R v. H% K- y+ t
| | 7 j& ~7 N Q" x) S+ y
| |
) B. J+ ]$ j* H: x4 K6 W( A; T2 G+ e5 j
| |
. z/ d& _5 r0 A/ \& K2 {
| | | | | + w6 z2 t* D4 V+ f
| | : P' G9 _1 L& z2 F) v$ x; i2 `
| | | + s# H: w2 j; {, n1 {' a, v9 U
| |
0 a4 S! ?/ W' \! n8 w8 S
|
更一般化的经典洛伦兹曲线模型为王祖祥(2007)提出的如下的二元参数模 3 d7 Q& y2 m# y
型:
4 C3 H' Z! O* d0 M1 D- J9 a | ( p ) [size=12.5000pt]= 1 [size=12.5000pt]- (1 [size=12.5000pt]- p ) b e[size=14.0000pt]-g p | | | ; T: H; o3 c: H
(9)式所表示的二元参数模型作为一个洛伦兹曲线的参数估计模型使用时 8 X2 a& B; \/ R; [
比基于帕累托的广义洛伦兹模型具有更好的性质。
- T. o( }* w+ r& B现在的研究成果已经证明:假定 L ( p) 为洛伦兹曲线,则对于任意的a 3 0 和 2 x; D1 ?1 C' O4 g1 t1 c4 N6 W
| | 6 F1 O. V& d5 x( z
| - T4 {/ Q. Q9 f: f$ g0 a$ g
| | 9 m) \ e5 C; `2 Z% k+ X
|
5 G) D8 D M) O+ x/ l0 C
| | | |
3 c- n1 W. j; T% o
| - F! C6 z/ V/ g7 [ J
| |
3 U9 e4 q4 B j0 }3 z7 T' V4 w
|
: s2 {: p$ f0 _! {
| 都有 L' ' '( p)30,则当a30,h31 / 2 | | ) a5 @) }4 f- G2 L7 V" g4 T
|
4 E2 m/ {4 Q) k
| , c. C+ ^1 o% j5 I! D
| 且a + h 31时,L ( p) 也是洛伦兹曲线。 |
6 {! k% k- n) r S
|
/ H, i& K0 d7 }; A/ X国内外的专家学者在研究洛伦兹模型方面做了大量的工作,王祖祥、
" `4 m( C, W* E, ~Sarabia 等提出了一系列的洛伦兹曲线模型,除上面提到的公式(9),如:
$ K' Z# o6 y8 k7 m8 G
) {5 L: k3 z. n* ^ g' e. J5 c) B6 [8 o; Y9 } s+ P
7 8 w2 j, ^ C1 G
$ S) ]/ u9 R8 |6 d7 pL ( p ) [size=11.5000pt]= pa |
3 S; D" b' k4 I) |
| | ; p4 H; @! a B
| |
, b$ _! f0 \* U' W9 d* ^3 D
|
$ Z# f# M# ?, V7 K
| . ?6 M' T: @- m- b. c( X
| 6 H% Z! M" t' b, W" P! p/ |
|
1 U' _. V0 `; I' D8 P# M
| * x7 _! J8 F) H2 g! a8 }
| $ g8 k8 \" f% G
| $ r- L8 u O5 `: @4 H$ K
|
4 P9 q) x" p$ ]/ L' c' K/ J
|
- M* N6 ^% Y$ Z$ }8 D i1 V1 t
| & k4 Y1 p3 b9 U( t* I
| | 8 Q, t2 ~4 H+ g
| |
9 g% J1 D+ h( N
| # N, j" i8 Q9 n& [8 W
| 2 {( C/ Z) ]6 ~( \
|
( k; Z) a/ C9 k+ i- f! I. F! ~
|
) t; d9 n z6 L3 D) {" c/ Y" t
| ) H. \6 ]" `, a
|
+ `& g; B$ [) X) i
|
. V# s. x* m& Z
| $ Y2 r# a/ P) a! r6 |3 |, U" ]& b
| | & `- u# J' p4 H" m+ E0 V- ^/ C
| | * h+ B! ?9 L P6 u) _- Z7 E e% b
| 5 u$ j) B1 x! I4 U! ~2 [
| % y* e, [; }% X' e" J- L
| 6 \3 X1 k/ {& @" O$ h) M1 b# |
| - e% [, N* [2 K
| " O% v8 F& u) O" r8 u w( q' g
|
4 ~8 i5 u8 o+ G i# p: L* \
| * H" M# s7 s. `
|
3 N" s( L0 N/ Y3 w+ M
|
" c4 Q9 O: ^, L; u) p% |
| | 5 B: `% U7 x; b3 _
| ! f) z2 P$ W5 c" S2 L R
|
, \; p Y) b! ]3 W
| | " t9 n# E0 ~- V# u3 u; G
| 1 ]5 O, q0 Z6 ]3 N" G7 O
|
+ c# V/ Q6 G0 K
| |
. G6 v8 E, _& U% [: i. W
| 4 b2 J* s: i: D3 }" j. n. m4 S# [
| |
* h! `9 F$ g$ q# }. I
| 5 E2 h; _& z% F9 L+ y$ X
| 2 [ Y" W9 L3 ^/ J
|
0 r/ \: p* A9 v. k q
|
; F9 ]( j- w+ n5 z
| | 9 o; d4 m8 @' Z+ W
| | | 9 R8 U2 e* T" M$ b4 x3 ?- d
|
( l( Z( G1 ]# B! B% k: A
| 9 Z* d: P. V+ T3 R' Z
| | " S& y5 H5 C4 U$ C
|
; t+ {0 ? @; O' g
|
, e% B; s7 u: z* u! D
|
1 j J8 U+ J+ P/ |7 p
| | |
; U: D1 p" t# K. r4 r6 t! {
|
4 E9 n8 Q( E, I5 Z! I
| : x+ L) o; c; J6 v# c
| | ) `) z) e. F. T* }1 p
| | : K/ {3 O8 {/ s! [+ C+ l- E4 {, h
|
2 u- H# x% Y3 y
| : p m+ a1 C: I+ X
|
* k: }7 B& p4 Z2 q2 b
|
5 d' h5 @/ t6 R/ u
| ' A: x# Y [0 d6 \9 U, p% Q% T
| 0 {. I( Z% P/ T0 y; v% Z
|
, L* m$ y+ M4 j! G/ i
| | ' r4 y2 @; J j5 j- I
| # A1 g* X' l: m/ u0 h8 s' U
|
6 p( t% X4 w8 l( H
|
7 K7 h3 e" [; c6 u$ v" J( a8 h6 _
| 3 D7 o/ c. C) U1 f4 G
| , w2 y4 {& F9 _5 P) g
| |
. g9 Z0 ~2 W6 D2 \; ~" w4 p
| L ( p ) [size=12.0000pt]= [1 [size=12.0000pt]- (1 [size=12.0000pt]- p ) b ]a [1 [size=12.0000pt]- (1 [size=12.0000pt]- p)h ]l | 9 I+ E9 b5 g2 Z, n! U
|
* B0 u7 B1 v) W/ a' f$ X. c
| 6 N% s5 l7 v J0 P
| 9 ^6 w3 h9 M. w2 w. E
|
( o, C* i- \. ?
| |
1 Y( t) ?; K$ |/ M* Z
| L ( p ) [size=12.0000pt]= p | | | | | |
: a1 O0 m, Z0 a
| | | | | |
, _+ h }8 p3 w4 U$ j6 \8 Q2 O
|
3 T. _$ K! M3 s. i# l& `0 }
|
+ S# g" L8 ?- D& B
| 1 x5 I1 A+ \! S; r3 \
| % H8 p: `' W+ v: M: h
| | " k, N- }# p( w# i) P" @3 Q
| 2 [4 Q4 d9 E& m* ~
| | |
: D. [7 k# K0 g; }+ o; {
| z ?9 l5 Z( a' C8 l" t0 ?
|
在研究现有文献基础上,按照洛伦兹曲线应满足的性质以及推导定理,本文构建了基于指数成份的洛伦兹模型 L( p,t ) ,形式如下: * y0 \. E% t: Y' j5 v
L ( p )=[1-(1- p )a e -bp][1-(1- p )g e-hp] | | # N, R2 g4 T, y$ ]/ U$ w/ R1 f
|
2 K8 s& b$ I; ]$ ^
|
4 g g) U. j2 `1 D* B$ M. p
| 其中, 0 £ a + b £1, 0 £ g + h £1。 | 8 C* h8 O& \! L/ H) m' U
| 4 Z' ?) a. S1 y( B# k! _
| | 7 _8 A: q3 S. b$ f( k/ f6 w
| 6 V; I2 z3 Y/ {5 |0 }
| |
, Q8 W4 H* \: x. m6 q
|
& t5 {/ r% B3 x% M
| | # \, k+ D4 H j( M/ d4 Q3 f4 R
|
, M* \; B/ K& ~& h
|
# g% M$ u0 k! O+ w# @L'( p )=[a(1- p )a-1 e -bp][1-(1- p )g e-hp]+
$ p( U) b; y( [2 J6 z[1 - (1 - p )a e - b p ][g (1 - p )g -1 e -h p + h p (1 - p )g e-h p ]
/ I' p) V3 y. G1 g3 `- _在满足条件 a + b 3 0 , g + h 3 0 的情况下,当 p Î[0,1] 时,满足 # R! y# q9 l/ J$ ^( |) ]- F% X
L'( p )30。
$ R1 F8 M4 b( v: d0 eL' '( p )=[a(1-a)(1- p )a-1 e -bp-ab p (1- p )a-1 e -bp+b(1- p )a e-bp - z4 X3 t4 g, x0 [. M6 K4 _
- ab p (1- p )a-1 e -bp-b2 p 2(1- p )a e -bp][1-(1- p )g e-hp]
1 q( U% v$ F' Y+ 2[a (1 - p )a -1 e - b p + b p (1 - p )a e - b p ][g (1 - p ) g -1 e-h p
- p( d H. y3 S; b+ h p (1- p )g e -hp][g(1-g)(1- p )g-1 e-hp
8 N: C* g# }8 z. ~+ o- gh p (1- p )g-1 e -hp+h(1- p )g e-hp 0 t+ D) Q, a/ h# ~' S# g
- gh p (1- p )g-1 e -hp-h2 p 2(1- p )g e -hp][1-(1- p )a e-bp] & g6 e, M: k, }+ h/ R
= [(a + b ) - (a + b ) 2 - b 2 p 2 (1 - p )](1 - p )a -1 e-b p ( U8 M, M- Q$ m- T4 y
+ [(g + h ) - (g + h ) 2 - h2 p 2 (1 - p )](1 - p ) g -1 e-h p
1 e5 o3 Y% m( F8 g& W4 H当满足条件a + b £1,g + h £1的情况下,当 p Î[0,1]时,L'' ( p) 3 0 。 7 z4 c) Y8 x' m9 R, F
综上所述,新构建的洛伦兹模型模型(14)式满足洛伦兹曲线的定义及性质, 6 a+ A: x: H6 F0 s
8 # s3 {6 f3 `# a9 N- c' n2 D
0 F4 b. A ]$ T8 j4 F& j" O- ~- \6 o! ^$ ^7 H4 v: d; H
可以用来拟合题目中给出的数据,并且与现有经典洛伦兹模型做出比较。 8 u y% k$ [3 s: I
3.1.2 模型的计算与比较
$ e: B2 h8 O& I& {* {, @7 s) v有关收入与人口的数据一般情况下可以得到收入人口分布的分组数据,这种数据的完整形式为(pi ,xi file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml9080\wps2.pngm),i=1,2, ,n或者(pi,Li),i=1,2, ,n,其中xi是收 7 ^6 ^$ f3 U) Q/ J2 N% b
入区间点,满足 0 £ x1 < x2 <
+ \& x+ ~3 a" y9 F7 Z' r2 t |