数学建模社区-数学中国»论坛 › 【数模论坛】国家竞赛 › 全国研究生数学建模竞赛(GMCM) › 第十届研究生数学建模—新解读之模型的建立与求解

查看: 1486|回复: 0

第十届研究生数学建模—新解读之模型的建立与求解

[复制链接]

字体大小: 正常放大

杨利霞

5250 主题	81 听众	16万积分

TA的每日心情

	开心 2021-8-11 17:59

签到天数: 17 天

[LV.4]偶尔看看III

网络挑战赛参赛者

自我介绍: 本人女，毕业于内蒙古科技大学，担任文职专业，毕业专业英语。

群组: 2018美赛大象算法课程

群组: 2018美赛护航培训课程

群组: 2019年数学中国站长建

群组: 2019年数据分析师课程

群组: 2018年大象老师国赛优

电梯直达

1^#

发表于 2019-9-25 11:50 |只看该作者 |倒序浏览

|招呼Ta 关注Ta

第十届研究生数学建模—新解读

之模型的建立与求解

5.1 洛伦兹曲线模型

正如我们在前面的问题分析中提到，目前国外经济理论文献中存在的模型大多是简单的函数关系式，含有的参数一般不超过三个，拟合效果不甚理想，有些甚至不满足洛伦兹曲线的条件。实际应用中，可以通过数据拟合的方法确定其中的参数来调整曲线的形状，使曲线尽量通过给定的各个数据点，即让拟合曲线与各数据点的误差尽可能小。显然，参数设置合理且参数个数适当的模型有可能得到更好的拟合效果。

为了方便后面的论述和证明，我们先给出我们在构造新的洛伦兹曲线模型时用到的王祖祥[ 11 ]总结的定理如下：

定理假定 f ( p) 和 g ( p) 都是洛伦兹曲线，当满足a 3 12 , b 3 12 ，且对于任

file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps1.pngfile:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps2.png

意 p Î[0, 1]，h￠￠￠( p) 3 0 和 g ￠￠￠( p) 3 0 时，L ( p) = h ( p)a × g ( p)b 也是洛伦兹曲线。

通过对现有文献的大量阅读研究，首先，我们创新性的提出了一种新的洛伦兹曲线模型：L ( p) = 1 - (1- p × m p-1 )a ，并证明当 m 3 1, 0 < a ￡1时，其满足洛

伦兹曲线的条件。

然后，我们学习、运用了 Ogwang 和 Rao[ 10 ]提出的用于建立混合的洛伦兹模型的加权积法，并通过比较，引入王祖祥[ 11 ]提出的洛伦兹曲线模型作为我们

新洛伦兹曲线模型的一个因子： L ( p) = 1 - Ll (1- p)b ，其参数的取值范围为：

(	-￥, 0	)	(	0,	û	0 < b ￡1 。根据前面提到的定理，我们进一步提出形
l Î	-￥, 0		è	0,	ln b -1 ù	0 < b ￡1 。根据前面提到的定理，我们进一步提出形

式为 L ( p) = h ( p)a × g ( p)b 的六参数洛伦兹曲线模型：

[size=12.0000pt]- [size=18.5000pt](1

[size=12.0000pt]- p [size=12.0000pt]× m

p-1

a ùm

[size=12.0000pt]é

[size=12.0000pt]- Ll [size=15.5000pt](1[size=12.0000pt]- p[size=15.5000pt])

b ùn

L ( p) = ê1

)

ë1

û ,

其中， Ll (1- p) =

el(1- p) -1

，

el -1

- 12 -

		(		)	(		[size=12.0000pt]û
参数的取值范围： m 3 1, l Î			-￥, 0		è	0,	ln b -1 ù ， 0	< a ￡ 1, 0	< b ￡1 ，
m, n 3	1	。
m, n 3	2	。
	2

参数 m, n 的取值范围由前面提到的定理给出，a , b , l 的取值范围参考了已

有的经典洛伦兹模型的参数取值范围， m 的取值范围是在证明其满足洛伦兹曲

线特征时推导得出。

接下来我们证明我们的模型是满足洛伦兹曲线特征能反映经济规律。

证明：

记 L1 ( p ) = 1 - (1- p × m p-1 )a ，L2 ( p ) = 1 - Ll (1- p)b ，显然，L1 (0)=0 ，L1 (1) =1， L2 (0 ) = 0, L2 (1) =1成立。下面我们分别证明 L1￠ ( p) 、L1￠￠ ( p)、L1￠￠￠ ( p) 均大于零。

L1￠ ( p ) = -a (1 - p × m p -1 )a -1 × ( - m p -1 - p × m p -1 ×ln m ) = a (1 - p × m p -1 )a -1 × ( m p -1 + p × m p -1 × ln m ) 3 0

L1￠￠ ( p ) = a {éêë(1 - p × m p -1 )a -1 ùúû￠ × ( m p -1 + p × m p -1 × ln m ) + (1 - p × m p -1 )a -1 × ( m p -1 + p × m p -1 ×ln m )￠üy t

= a éêë(a - 1)× (1 - p × m p -1 )a -2 × ( - m p -1 - p × m p -1 × ln m ) × ( m p -1 + p × m p -1 × ln m )

+ (1 - p × m p -1 )a -1 × ( m p -1 × ln m + m p -1 × ln m + p × m p -1 ×ln2 m )ùû

记 f ( p ) = 1 - p × m p -1 3 0, f ￠( p ) = - m p -1 - p × m p -1 × ln m ￡ 0

L1￠￠ ( p) =a éë- (a - 1)× f ( p )a -2 × ( m p -1 + p × m p -1 ×ln m)2

+ f ( p )a -1 × ( 2 m p -1 × ln m + p × m p -1 ×ln2 m)ûù 3 0
L1￠￠￠[size=15.5000pt]( p [size=15.5000pt]) [size=12.0000pt]= a [size=18.0000pt]ê[size=18.0000pt]é [size=12.0000pt]- [size=18.0000pt](a [size=12.0000pt]- 1[size=18.0000pt]) [size=12.0000pt]× [size=18.0000pt](a [size=12.0000pt]- 2 [size=18.0000pt]) f [size=15.5000pt]( p [size=15.5000pt])a [size=16.5000pt]-3				[size=12.0000pt]× f [size=12.0000pt]￠[size=15.5000pt]( p [size=15.5000pt])[size=12.0000pt]× [size=9.0000pt]ç[size=18.0000pt]æ m p [size=16.5000pt]-1 [size=12.0000pt]+ p [size=12.0000pt]× m p [size=16.5000pt]-1 [size=12.0000pt]× ln m [size=9.0000pt]÷[size=18.0000pt]ö 2			- (a - 1)× f ( p)a -2 ×
ë		ø	è		è	ø	ø	(	)
è		ø	è				ø	(	)
2 çæ m p -1	[size=12.0000pt]+ p	× m p -1 × ln m ÷ö	× çæ m p -1 × ln m + m p -1 × ln m + p× m p -1 × ln 2 m ÷ö					[size=12.0000pt]+ a [size=12.0000pt]- 1		[size=12.0000pt]×
f ( p )a - 2 × f ￠( p )× çæ 2 m p -1 × ln m + p × m p -1 × ln2 m ÷ö						+ f ( p)a -1 ×
		è			ø
çæ 2 m p -1	× ln 2	m + p × m p -1 ×ln3		m ÷ö	úù 3 0
è				ø	[size=9.0000pt]û

对于 L2 ( p ) = 1 - Ll (1- p)b ，我们同样要证明 L2￠ ( p)、L2￠￠ ( p) 、L3￠￠￠ ( p) 均大于零。 L2￠ ( p ) = - b Ll (1 - p )b -2 Ll￠ (1 - p) 3 0

- 13 -

L2￠￠ ( p ) = - b Ll (1 - p )b -2 Ll ￠ (1 - p )éë ( b - 1)Ll ￠ (1 - p )- lLl (1- p )ùû

= - b Ll (1 - p )

b [size=7.0000pt]-2

￠

(1 - p )

l é

- be

l(1- p) ù

3 0

ë1

el [size=12.0000pt]-1

L2￠￠￠ ( p ) = êé - b × Ll ￠

[size=15.5000pt](1 [size=12.0000pt]- p [size=15.5000pt])[size=12.0000pt]× Ll [size=15.5000pt](1[size=12.0000pt]- p[size=15.5000pt])b [size=14.5000pt]-3

úù ×

íì êé l Ll (1 - p )+ (1 - b ) Ll ￠ (1 - p )úù 2

- (1 - b ) Ll ￠ (1 - p )êé - Ll ￠ (1 - p )- lLl (1- p)úù

[size=7.0000pt]y[size=10.5000pt]ü

î ë

[size=11.0000pt]t

我们注意到，对任何的 l 1 0 ，都可以得到 l /

(

)

< b ￡1，

- 1 > 0 ，且当 0

(

)

(

[

都有1 - b × e l(1- p) 3 0 ，

l [size=12.0000pt]Î

-￥, 0

b -1 ù 时，对于任何的 p Î

因此

( b - 1)Ll ￠ (1- p )- l Ll (1- p ) = ell-1 éë1 - bel(1- p) ùû 3 0 由于 - Ll ￠ (1 - p ) 3 ( b - 1)Ll￠ (1- p) ，

故 - Ll ￠ (1 - p )- l Ll (1 - p ) 3 ( b - 1)Ll ￠ (1 - p )- lLl (1 - p) 3 0

由此可知，对于任何 p Î[0, 1]，都有 L2￠￠￠ ( p) 3 0 。

file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps3.png

最后，根据我们在前面提到的定理，

L ( p ) = L1 ( p )m × L2 ( p )n

- (1 - p

× m

p-1

a ùm

[size=12.0000pt]×

ùn

= ê1

)

ë1

- Ll (1- p)

在参数取值范围为：m 3 1, l Î

-￥,

)

ln b -1 ù

，0 < a ￡ 1,

0 < b ￡1，

(

m, n 3	1	时，满足洛伦兹曲线特征，能够反映经济规律。
m, n 3		时，满足洛伦兹曲线特征，能够反映经济规律。
2
证毕。
实际操作中，从分组数据出发，通常利用非线性最小二乘法极小化残差平
方和：
			n	2
			D = å(L ( pi , t )- Li )
			i=1
得到参数估计tˆ = (mˆ			ˆ ˆ
得到参数估计tˆ = (mˆ			, aˆ , b , l, mˆ, nˆ)，从而得到近似的洛伦兹曲线 L ( p, t ) 。

应用某些参数变换，可以将约束非线性最小二乘问题化为无约束的，使得可以应用无约束最小二乘法进行参数t 的估计。对于我们提出的模型，依次令：

- 14 -

m = 1 + x 2	,	a = sin 2 x ,	b = sin 2 x , l = ln	1	- x 2	,	m =	1	+ x 2	,	n =	1	+ x2
				sin 2 x				2				2
1		2	3		4				5				6
				3

将这些关系式代入模型，用无约束非线性最小二乘法求 (x1 , x2 , x3 , x4 , x5 , x6 )

的估计值，得到 (xˆ1 , xˆ2 , xˆ3 , xˆ4 , xˆ5 , xˆ6 ) 后再代回到这些关系式中，从而得到模型的

参数估计：

mˆ = 1.8839, aˆ = 0.9450, lˆ = 0.1961,

bˆ = 0.6979, mˆ = 0.7299, nˆ = 0.8532

tˆ = ( mˆ , aˆ , lˆ , bˆ, mˆ, nˆ)= (1.8839, 0.9450, 0.1961, 0.6979, 0.7299, 0.8532)

进一步，根据题目中给出的拟合精度好坏的三种标准（均方误差 MSE、平均绝对误差 MAE、最大绝对误差 MAXABS），我们从表 1 中找出 10 种经典的洛伦兹曲线模型，与我们提出的新模型进行拟合精度比较，其结果如表 3 所示：

表 3 洛伦兹曲线模型拟合精度比较

file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps4.png

模型	*MSE* ′105	*MAE*	*MAXABS*
Kakwani, Podder	26.1715	0.012307361	0.040884892
Rasche	1.82	0.003770065	0.007969035
Sarabia	305.1689	0.049608248	0.077400319
Chotikapanich	27.3831	0.014086406	0.035882638
Ogwang, Rao	0.847	0.002660626	0.005344326
Kakwani	0.397	0.001681175	0.004074109
Gupta	26.6009	0.01309733	0.039512905
Ortega	0.938	0.002741163	0.005523367
Wang	1.09	0.002923999	0.006295658
Wang, Smyth	25.1554	0.014405156	0.02606061
我们的模型	0.354	0.00140883	0.005581551

通过比较我们的模型和表中十个模型的拟合精度，我们观察到，以均方误差为评价标准，我们的模型排第一；以平均绝对误差为评价标准；我们的模型排第一；以最大绝对误差为标准，我们的模型排第三。

为了更直观、综合地反映模型的拟合精度好坏，我们在这里对其作一个简

单的打分。记各项标准中，排第一位的模型得分为 10 分，第二位的得 9 分，依

次递进，排最后一位的模型得 0 分。再把每个模型在 3 项评价标准中的得分相加，其总分即为该模型的拟合精度得分，得分越高，拟合精度越好。其结果如

- 15 -

表 4 所示：

表 4	模型拟合精度综合评定排名

模型	得分	拟合精度排名

Kakwani,Podder	8	8
Rasche	15	6
Sarabia	0	11
Chotikapanich	6	10
Ogwang, Rao	25	3
Kakwani	28	1
Gupta	7	9
Ortega	22	4
Wang	18	5
Wang, Smyth	9	7
我们的模型	27	2

file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps5.png

可以发现，在我们选出的 11 种模型中，拟合精度最高的洛伦兹模型是 Kakwani[ 5 ]在 1986 年提出的三参数洛伦兹模型，我们的模型排在第二位，其拟

合精度排在前列，并不比之前的经典的洛伦兹模型差。

5.2 中等收入人口界定方法

在研究中等收入者的相关问题时，首先要解决的问题就是界定中等收入者

的范围。现今，在经济理论学界，通常使用两种方法——收入空间法与人口空间法来确定该范围。但简单地使用这两种方法会产生许多问题，甚至会导致在分析数据时出现截然相反的结论，本节我们的工作就立足于改进这两种方法，提出一些合理的界定中等收入人群的方法。

5.2.1 改进收入空间法

收入空间法通过给出收入区间来确定中等收入人群。传统的收入空间法中，

收入上下界 xl 与 xh 的取法具有任意性，不能说明经济发展与收入分布的实际情

况，为了克服这个不足，我们从以下两个角度提出相关的改进方法。

1. 基于比例的范围界定

采用传统的收入空间法时，存在的一个重要不足是，在固定上下界 xl 与 xh 的

值后，中等收入人口不能反映经济进步的影响。通常情况下，所有人口的收入

- 16 -

会逐年变化，而使得全社会的收入区间发生移动，因此，直观来看中等收入区间也应随之移动。根据这一分析，我们通过下式来确定 xl 与 xh ：

xl = (1 - a ) × m xh = (1 + a ) ×m,

其中，a 为一个给定的百分比值。由此，当全社会收入中位值发生变化时，中等收入的上下界也能随之变化，使中等收入区间始终位于社会收入中值附近的一个合理范围内，使纵向比较各年的中等收入人口时更为合理。

2. 基于统计指标的范围界定

基于百分比的范围界定方法解决了传统方法中 xl 与 xh 的取值不能反映经济发展、收入变化情况的不足，但采用这种方法时，没有考虑当年社会人口收入的总体分布情况，为此我们将收入分布的一些统计指标纳入计算之中。

（1）基于极差的计算方法

当整个社会中高收入与低收入群体的差距变大时，中等收入的范围也应有所扩大。据此，我们给出下式：

xl = m - d xh = m + d , d = ( xmax - xmin ) / n,

其中，xmax 与 xmin 分别为社会收入总体中的最大值与最小值，n 为整数参数。

（2）基于标准差的计算方法

当整个社会中收入的波动情况不同时，中等收入的范围也应有所变化。波

动越大，直观上看中等收入的范围应该越大。据此，我们可以通过下式计算 xl 与

xh ：

xl = m - D xh = m + D,

其中， D 为收入总体的标准差。该式的含义是，中等收入人口的收入应该在总

体中值附近波动，而这个波动可以由总体的标准差来确定。

采用基于统计指标的界定方法反映了总体分布情况对中等收入人口范围的

影响，但它也存在一些不足，例如当社会收入两极分化极其严重时（即 d 的取值非常大），采用基于极差的计算方法会使中等收入的范围变得非常大，这显然与现实情况不符合。为此，我们结合基于比例与统计指标的方法，提出一种综合的计算方法：

ïìxl

ïîxh

= max {a ' m, m - d}

= max {a '' xl , m + D},

其中，a ' 与 a '' 为两个比例参数，且 a ' <1，a '' >1；其余参数的含义与上述相同。该计算方法的含义在于：当总体收入差距变大时，中等收入的下界可以适当放

- 17 -

宽，但不能低于中值的一定比例；中等收入的上界 xh 是下界的 xl 一定倍数，使中等收入区间内的人口收入差距不至于过大，但同时也要保证 xh 大于总体的中值与标准差之和， m + D 可以视作中值合理波动的上界。

5.2.2 改进人口空间法

另一种确定中等收入人口范围的方法是人口空间法，即选择中值 m 邻近的一个固定人口比例范围为中等收入人口，再用这个人口比例范围来确定中等收入人口的收入范围。这个方法简单易行，可以清晰描述在社会总人口中位于中间部分的人群的收入状况，特别适合经济发展成熟，社会结构稳定的发达国家，例如美国、日本等都采用该方法来确定中等收入范围。但该方法存在以下三个缺陷：

1、人口比重的确定比较随意，没有反映社会总体的收入情况；

2、中等收入人口占总人口的比重始终是固定的，无法反映经济发展、收入

结构变化的情况，尤其不适应当下发展中国家不断发展、变革的实际；3、如题目中所言，无法反映两极分化对中等收入人口所占比重的影响。

中等收入人口的多少与两极分化的程度有关，所谓两极分化，用密度函数表示就是严重右偏且厚尾，也即中间部分空洞化。因此直观上看，两极分化越严重，中等收入人口应越小，反之则意味着中等收入人口扩大。

为了克服人口空间法的缺陷，体现两极分化对中等收入人口范围的影响，一些学者研究使用基尼系数来确定中等收入人口的比重，但这种基于基尼系数的改进人口空间法存在一个问题：基尼系数描述了社会收入总体上的不平等程度，但并不能描述社会人口收入两极分化的情况。两极分化与收入不平等是两个不同的概念，收入不平等并不一定意味着两极分化。例如，当高收入人群与低收入人群内部的收入不平等十分严重时，总体的收入不平等程度也会加重，即基尼系数变大，但此时，这种内部的不平等使得位于收入分配两端的人群向中间部分靠拢，也就是说两极分化程度反而减轻了，中等收入人口数量有所提高。因此，我们需要使用准确的两极分化指标，重新测算两极分化与中等收入人口比重之间的关系。

文献[12]对两极分化的概念与现象进行了准确阐述，并给出了一种说明两极分化严重程度的指标 P，该指标值越大说明两极分化的程度越严重，其计算方式如下：

P = ( T - G ) mm ,

file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps6.png

其中，T = ( m U - m L )file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps7.pngm ， mU 与 m L 分别表示收入大于、小于中值 m 的人口的收

- 18 -

入均值，m 是整体的均值，由于 ( m U - m )file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps8.pngm = ( m - m L )file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps9.pngm ，因此 T 反映了将每个在中值以下的人口收入提升到总体平均值所需要的收入，即相对中值的偏移程度；G 是基尼系数； mfile:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps10.pngm 表示了概率密度函数的右偏程度。

由文献[12]中的推导可得 T = 1 - 2L(0.5) 。另，根据公式 L '( p ) = xfile:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps11.pngm ，可求得 m = mL '(0.5) ，而 G = 1 - 2ò01 L ( p )dp 。所以，根据人口收入的洛伦兹曲线，可求得 P 值如下：

P = ( T - G ) mm

file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps12.png

= (1- 2L (0.5) - 1 + 2ò01 L ( p )dp )mL 'm(0.5)

file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps13.png

2	(ò01 L ( p )dp - L (0.5))
=		.
=	L '(0.5)	.
	L '(0.5)

为了获得两极分化指标与中等收入人口比重之间的定量关系，我们分析了世界银行公布的 42 个国家的五分法收入分配情况。不失一般性地，我们以中国的数据为例，说明具体分析计算步骤如下。

表 5 中国五分法收入分配表

file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps14.png

	最低 20%	第二个 20%	第三个 20%	第四个 20%	最高 20%

收入比重(%)	5.9	10.2	15.1	22.2	46.6
收入累计比重(%)	5.9	16.1	31.2	53.4	100
人口累计比重(%)	20	40	60	80	100

步骤 1. 拟合收入分配的洛伦兹曲线

根据五分法收入分配表，可以得到人口累计比重与相应收入累计比重的五个数据点。由于数据点数量较少，不适宜采用参数较多的洛伦兹曲线模型进行

拟合，因此，我们使用 Gupta 模型对这五个点进行拟合，可得到洛伦兹曲线模型如下：

L ( p ) = p ×5.6762p-1.

- 19 -

file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps15.png

图 2 中国收入分配的洛仑兹曲线

步骤 2. 计算中等收入人口比重

参照文献[13-14]的定义，以在中值附近，人群总收入占社会总收入 60%的人群作为中等收入人口，从而可由下式求得中等收入人口的比重：

Wmid = L-1 (0.8)- L-1 (0.2).

对于中国而言，Wmid = L-1 (0.8)- L-1 (0.2) = 0.92 - 0.49 = 0.43 ，即中国的中

等收入人口比重为 43%。

步骤 3.计算两极分化指标值

依据中国收入分配的洛伦兹曲线，按照两极分化指标的计算公式，可得中国的两极分化指标值 P = 0.2367 。

按照上述过程，依次计算其余 41 个国家的中等收入人口比重与两极分化指标，图 3 显示了这 42 个国家两极分化指标与中等收入人口比重之间的关系。

file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps16.png

图 3 两极分化指标与中等收入口比重的关系

- 20 -

从图 3 中可以看出，两极分化指标与中等收入人口比重之间具有明显的线性关系，且两极分化指标越大，中等收入人口比重越小，符合经济直观要求。对上述散点做线性回归，可得到结果如下：

Wmid = -0.5 P + 0.6348,

调整后 R2=0.9948，SSE=4.73×10-4。由该结果可知两极分化指标与中等收入之间具有高度线性相关的关系。同时，由于计算过程采用的样本是各个处于不同

发展阶段的 42 国家，具有较好的代表性，所以上述计算分析结果较为可信，当得到两极分化指标后，可以通过上式计算得到中等收入人口比重。

这种基于两极分化指标的改进人口空间法，依据收入分配的洛伦兹曲线，通过合理的计算与分析，由两极分化指标得到中等收入人口比重。该方法克服了传统人口空间法中确定比重较为随意、无法反映收入分配结构与中等收入群体成长过程等缺陷，使分析结果更符合经济客观，更具有纵向与横向可比性。

5.3 A B 两地区中等收入情况分析

首先，我们对 A、B 两个地区前后两年的收入分配数据进行常用统计指标上的分析。图 4 显示了该四组数据的累积分布函数。

file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps17.png

(a) A 地区 (b) B 地区

图 4 A、B 两地区各年份的累积分布函数

从图中可以看出 A、B 两个地区，后一年的累积分布函数曲线较前一年都出现明显的右移，这表明，随着社会经济的发展，A、B 两个地区所有人口的收入都提高了，A、B 两个地区中等收入区间也应随之右移。同时，仔细观察

还可以看到，A 地区在高收入段的右移程度相较其他阶段更为显著，这说明 A

地区高收入群体的增加收入更多，社会财富进一步向高收入群体集中。表 6 说明了这四组数据在常用指标值上的取值情况。需要说明的是，为了便于计算，我们取各个收入分组的中值代表该分组的收入情况， f (m) 表示概率密度函数

在总体中位数处的取值。

- 21 -

		表 6 A、B 地区各年份统计指标值

地区	年份	均值 m	中位数 m	方差 D 2 (′107 )	f [size=15.5000pt](m[size=15.5000pt]) [size=18.5000pt]([size=12.0000pt]′10[size=13.5000pt]-4 [size=18.5000pt])

A	1	6281.34	4887.00	0.94	1.18
A	2	8890.21	6872.78	1.95	0.82
	2	8890.21	6872.78	1.95	0.82
B	1	16938.46	13797.87	4.45	0.55
B	2	22228.53	18707.20	7.61	0.40
	2	22228.53	18707.20	7.61	0.40

从上表可以看出，A、B 两个地区在前后两个年份的均值与中位数都有较

大的增长，表明这两个地区的经济都有较快的发展。A 地区年份 2 的均值较年份 1 增长了 41.53%，而 B 地区均值的增长率为 31.23%，这说明 A、B 两地区的发展都比较大，但 A 地区的发展更为明显。比较中位数前后两年的变化可以

发现，A 地区的中位数增长率为 40.63%，B 地区的为 35.58%，值得注意的是，

A 地区中位数的增长率小于均值的增长率，而 B 地区恰恰相反。这个结果说明，

A 地区的收入增长较快，但其中等收入人群的收入增长没能赶上平均增长率，中等收入人群收入所占社会总收入的比重在减小，结合图 4 中的分析，可以认

为 A 地区的财富在向高收入群体集中。而 B 地区的收入增长主要发生在中等收入群体中，中等收入群体在社会总收入中的比重在增加。 f (m) 的大小体现了

概率密度函数在中位数附近隆起程度的高低，即收入在中位数附近概率的大小，直观来看 f (m) 越大，则说明收入出现在中位数附近的人口越多，也就是中等收入人群越多。表中数据表明，A 地区后一年的 f (m) 值出现明显下降，减少了一个数量级，这说明 A 地区的中等收入人口规模在减小；而 B 地区的 f (m) 值

变化不大，基本保持稳定，说明 B 地区的中等收入人口规模没有发生大的变化。

综合上述分析，我们可以得出一些定性的结论：

1. A、B 两个地区的人口收入都有明显的增长，且 A 地区的增长速度更快；

2. A 地区中，中等收入人群的收入占社会总收入的比重在减小，中等收入人群的规模也在减小，社会财富出现向高收入人群集中的现象；

3. B 地区中，中等收入人群的收入占社会总收入的比重在增加，且中等收入人群的规模变化不大，社会财富进一步向中间人群集中。

通过上述常用统计指标的分析，我们获得了一些定性结论，对 A、B 两个地区的发展情况有了概略的了解，但这些结论缺乏定量数据的支持，无法给出定量结论。

下面，我们利用前文所提出的模型与方法对 A、B 两个地区的收入分配情况、中等收入人群状态进行定量分析，以期获得相应的定量结果。

- 22 -

首先，我们利用章节 5.1 所提出的洛伦兹曲线模型对 A、B 地区前后两个年份的收入分配情况进行描述。对四组数据的拟合结果如下：

p-1 a ùm

[size=12.0000pt]é

ùn

el(1- p) -1

L ( p ) = ê1 - (1

- p × m

)

ë1 - Ll (1 - p)

, 其中 Ll (1

- p) =

-1

A 地区年份 1：tˆA1 = ( mˆ

, aˆ

)= (2.90,

0.72,

-1.32,

0.97,

0.5,

0.53)；

, l , b

, mˆ, nˆ

A 地区年份 2:tˆA 2 = ( mˆ

, aˆ

)= (2.96,

0.74,

-1.49,

0.95,

0.5,

0.51)；

, l , b

, mˆ, nˆ

0.65,

-0.65,

0.99,

0.5,

0.5) ；

B 地区年份 1:tˆB1 = ( mˆ , aˆ , l , b, mˆ, nˆ)= (2.09,

B 地区年份 2:tˆB 2 = ( mˆ

, aˆ

)= (2.47,

0.79,

-0.85,

0.98,

0.5,

0.5)。

, l , b, mˆ, nˆ

file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps18.png

(a) A 地区年份 1 (b) A 地区年份 2

file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps19.png

图 5 A、B 地区各年份的洛仑兹曲线

根据各组数据的洛伦兹曲线，按照章节 5.2 中提出的基于两极分化指标的改进人口空间法，我们可以计算得到各组数据的两极分化指标、中等收入人口比重。进而，我们可以获得中等收入范围的上下界与中等收入人口的状态，这两个值得计算过程较为简单，且已在题目中阐述，这里不再做介绍。我们直接将相关结果的数据列在下表中。

- 23 -

表 7 A、B 地区各年份收入分配情况

		基尼	两极分化	中等收入	收入	收入	中等收入
地区	年份	系数	指标	人口比重	下界	上界	人口状态
		G	P	Wmid (%)	xl	xh	S (%)

A	1	0.338	0.192	53.88	2847	9433	47.01
A	2	0.344	0.196	53.69	3967	13383	46.88
	2	0.344	0.196	53.69	3967	13383	46.88
B	1	0.268	0.145	56.25	9342	24348	49.24
B	2	0.254	0.135	56.71	12739	31556	52.44
	2	0.254	0.135	56.71	12739	31556	52.44

从上表的结果数据可以发现，A 地区的基尼系数、两极分化指标均变大，表明 A 地区收入分配的不平等程度与两极分化程度都在加剧，这直接导致中等收入人口比重减少了 0.19%，中等收入人口状态，即中等收入人口的总收入占社会总收入的比例减少了 0.13%。这个结果定量地说明，A 地区中等收入人口规模在减少，且占有的社会总收入量也在减少，结合上文的定性分析，我们可

以认为该部分减少的量在向高收入群体转移。观察 B 地区的数据可以发现，B

地区的基尼系数与两极分化指标都在减小，说明 B 地区的收入分配变得更为平等，两极分化程度在减弱，这在中等收入人口情况上的表现就为中等收入人口

比重增加了 0.46%，占有的收入总量增加了 3.20%，该结果定量地表明 B 地区中等收入人口规模在扩大，同时占有的社会总收入也在增加，社会财富在向中间阶层集中。

综合上述定性与定量分析，我们可以得到如下结论：

1. A 地区的中等收入人口比重与收入状态均在减小，表明 A 地区的中等收入人口规模与占有的财富总量均在缩水；

2. B 地区的中等收入人口比重与收入状态均在增加，说明 B 地区的中等收入人口规模与占有的财富总量均在扩大；

3. A 地区的收入分配结构有呈到三角的趋势，社会财富在向高收入人群集

中；B 地区的收入分配结构已形成稳定的橄榄型（中等收入人口的规模与收入占有量均超过 50%）；

4. 可以认为 A 地区处于经济发展阶段，而 B 地区经济比较发达，已进入稳定成熟的阶段。

- 24 -

5.4 一种新的中等收入模型

对中等收入人口的界定及研究, 是理论经济学的重要研究内容和研究方向,也是应用经济学新的研究领域和重要的研究方向。

对中等收入人口的界定, 依赖于社会经济发展的现状, 依赖于社会居民的结构, 还依赖于人们的认知。如何对中等收入人口进行科学的界定，以及如何对中等收入人口进行科学合理的测算一直是国内外学者普遍关注的一个问题。

中等收入是一个相对而不是绝对的标准，它具有如下三个特征：

1. 中等收入是相对于一个国家或一个地区的高收入和低收入而言的, 并没有一个固定的标准；

2. 中等收入是一个动态标准而不是静态标准；

3. 中等收入是区间数量而不是固定数量, 即中等收入是一个大体的区间,

不是一个固定不变的量。

通过阅读文献，我们发现，目前中等收入人口界定所面临的一个很大的问题是“伪中等收入问题”。据《2010 年北京社会建设分析报告》公布的数据，北京中等收入者人数为 540 万，占北京市户籍人口的 40％以上，然而，被认定

人群中，68.7％的人不认可自己的“中等收入”标签，社会一片哗然。究其原因，工薪阶层作为中等收入人群的主体，面临子女教育、购房、赡养老人等长期较大支出，如果在支付这些固定项目后用于日常消费的支出寥寥无几，就不能算是中等收入，这就是“伪中等收入问题”。

因此，我们在本文中提出一个新的考虑到个人生活质量的中等收入人口界定模型，着力解决中等收入问题中的“伪中等收入问题”。

定义：中等收入人口是指收入水平处于某一地区全体居民某一时期内中位收入水平上下一定范围内并且生活质量较好的人口数量。

原理：（1）该定义是以收入水平、生活质量作为确定中等收入者的条件，具有经济规定性。

（2）我们定义的中等收入水平不是一个绝对数, 而是一个收入水平区间, 且这一区间还是以一定地区、一定时期为特定条件的，具有社会规定性。

基于以上中等收入人口定义，我们进一步提出与之对应的中等收入人口测算模型。

在模型中，我们提出一个反映个人与中等收入人口特征的吻合程度的个人

中等收入吻合度指数 R。我们认为，该指数 R 受到个人收入水平和生活质量两

方面的影响，这里我们定义个人收入水平中等化评价指数 Z 以及个人生活质量

评价指数 H 来定量刻画其对 R 的影响。其中，个人收入水平中等化评价指数 Z

反映了某居民个人收入与中等收入人口收入水平的接近程度；个人生活质量评

- 25 -

价指数 H 反映了某居民现有生活质量的好坏程度。

我们现将这两个指数的生成原理及经济学意义分别介绍如下：

1. 个人收入水平中等化评价指数 Z

记第 i 个人的个人收入为 xi ，该地区个人收入的最大值和最小值分别为

xmax 、 xmin ，m 为收入分配密度函数曲线的中位数点对应的个人收入，则我们

定义第 i 个人的个人收入水平中等化评价指数 Zi 为：

Zi	= 1 -		xi - m
			xi - m

		max (m - xmin		, xmax	- m)
		max (m - xmin		, xmax	- m)

显然 0 ￡ Zi ￡1 ， Zi 越大，说明居民个人收入 xi 距离中位收入点 m 的距离

越近，表示该居民在收入上越接近于中等收入。该指数同时也与经济直观相符，

因为随着群体的两极分化扩大， Zi 的值是逐渐减小的，通过对群体中每个人的

Zi 值进行统计就会发现， Zi 取值较小的人口占总人口的比重就会增大，即群体

中偏离中等收入的人口增大，中等收入人口下降。

2. 个人生活质量评价指数 H

我们定义，可自由支配收入是除去子女教育、购房、赡养老人等必须支付的固定收入支出后居民用于提高其生活质量的收入，我们这里认为其主要由娱乐支出和个人储蓄两部分组成。显然，可自由支配收入占总收入的比例越高，表示居民的精神文明生活越丰富，手头闲钱越多，自然生活质量也越高。

记第 i 个人的收入为 xi ，娱乐休闲支出为 a1i ，个人储存部分为 a2i ，则第 i 个人的个人生活质量评价指数 Hi 为：

H = a1i + a2i

file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps20.png

i xi

显然，0 ￡ Hi ￡1， Hi 越大表示该居民的生活状态越好。一般情况下，高收

入者对应的 H 较大，低收入者对应的 H 较小。随着收入的增加，H 也在增加，

只不过在收入处于不同阶段时，H 增加的快慢程度不同，但总体上来说 H 是单调增的。随着 H 在超过一定范围后继续增大时，该居民就会向高收入者行列迈进。由此可见，H 只有在一定的范围内才能有效界定中等收入人口。我们定义

- 26 -

函数 K = f (H )，0 ￡ K ￡1，定量刻画出某居民在生活质量方面与中等收入人口

的接近程度，记群体的个人生活质量评价指数的中位数为 Hm ，则应满足

f (Hm ) =1， f (0 ) = 0 ， f (1) = 0 。这三个约束显然满足经济直观要求，当 H 的

取值为中值 Hm 时，显然与中等收入人口的生活质量最为接近，即 f (Hm ) =1；

当 H 为最大或最小值时，应当与中等收入人口的生活质量相差最大，即

f (0 ) = 0 ， f (1) = 0 。

同时， f (H ) 还应满足约束：当 0 < H < Hm 时， f (H )￠ > 0 且 f (H )￠￠ > 0 ，

也就是说此时随着 H 的增大，K 也在增大且增大的越来越快；当 H m < H <1时，

f (H )￠ < 0 且 f (H )￠￠ > 0 ，也就是说此时随着 H 的增大，K 在减小且减小的越来

越慢。这显然也是符合经济直观要求的，当 H 的取值远离 Hm 时，人群对生活质量的感受就不敏感，相应的 K 值变化也会变小。例如，当 Hm=0.3 时，H=0.98与 H=0.99 人群对生活质量的差别感应该不大，则 K 值的变化也应较小。图 6

显示了 f (H ) 曲线的一种合理形式。

file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps21.png

图 6 H-K 曲线示意图

2. 个人中等收入吻合度指数 R

综合上面提出的个人收入水平中等化评价指数 Z 和个人生活质量吻合度指

数 K，我们可定义某地区第 i 个人与中等收入人口特征的吻合程度指数的表达式为：

Ri = Z i a × Ki b ，其中a > 0 ， b > 0 ，a + b =1 ，

- 27 -

易知， 0 ￡ Ri ￡1 ，且 Ri 越大，第 i 个人与中等收入人口特征的吻合程度就

越好。取一个合理的q 值（ 0 < q <1 ），如果q ￡ Ri ￡1，就可判定第 i 个人属于

中等收入人口。

现记群体的总人数为 N，则中等收入人口的比例 Wmid 为：

åMi

Wmid = i=1N ，

file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml8444\wps22.png

其中 Mi	ì	1	, q ￡ Ri	￡1	.
	= í		, 0 ￡ Ri	< q
	î0

上述所提模型综合考虑了个人收入与生活质量对界定中等收入人口范围的影响。不妨举一例做说明，在某地的个人收入情况基本不变的情况下，如果实行了全面的医保，则会降低社会人口的医疗支出，由此生活质量评价指数提高，有更多的人可以达到中等收入吻合度阀值，中等收入人口比重扩大；反之，若没有实行医保，则显然会使中等收入人口比重缩小。这种模型符合人们生活的直观感受，能在确保满足经济直观的同时，使社会群体更易于接受中等收入的界定，避免出现“伪中等收入问题”。

六、结果分析

本文将十个已有的洛伦兹曲线模型与我们新提出的模型进行拟合精度比

较，以均方误差为评价标准，我们的模型排第 1；以平均绝对误差为评价标准；

我们的模型排第 1；以最大绝对误差为标准，我们的模型排第 3。进而通过对 3 个评价指标进行综合打分处理，我们的模型排在第 2 位。

在第二问中，对传统的收入空间法与人口空间法进行了改进。提出了一种基于比例的界定方法与统计指标的界定方法的综合收入空间界定方法；基于两极分化程度越严重则中等收入人口越小这一经济直观，提出了一种具有经济学意义的基于两极分化指标的改进人口空间法。

在第三问中，针对题中所给 A、B 两个地区前后两年的收入分配情况，我们运用我们提出的六参数洛伦兹模型拟合洛伦兹曲线，运用改进的方法界定中

等收入人口比重，得出 B 地区相较 A 地区的经济发展情况更为成熟、稳定。最后，提出了一个与经济直观相符的，解决目前普遍存在的“伪中等收入

问题”的新的个人中等收入吻合度指数 R 来度量个人与中等收入人口特征的吻合程度，然后根据该指数的值来界定是否属于中等收入人口范畴。

- 28 -

七、模型评价与拓展

1. 本文提出的洛伦兹曲线模型虽然拟合精度很高，但参数较多，模型较为复杂；可以考虑综合使用多项式拟合、样条拟合等其他拟合方法，以此来进一步提高精度并降低模型复杂度；

2. 本文对收入空间法的改进还有不足，相关参数的定义比较模糊，确定比较随意，可以做进一步优化；

3. 本文对人口空间法进行改进时，仅考虑了两极分化程度的影响，没有考虑其他因素，这显然是不够的。下一步应挖掘更多的经济直观，深入改进人口空间法；

4. 本文新提出的中等收入人口界定模型没有充分地考虑两极分化程度的影响，且未给出具体的函数表达形式，实际操作存在困难。下一步要研究各指数的函数表达形式，使指数的求值过程能简单、直接，并具有深刻的经济意义。

八、参考文献

[1] Lorenz M, Methods of Measuring the Concentration of Wealth [J], Journal of the American Statistical Association Vol. 9, pp.: 209-219, 1905

[2] McDonald J.B, Xu Y.J, A generalization of the beta distribution with application [J], Journal of Econometrics Vol. 66, pp.:133-152, 1995

[3] 成邦文，基于对数正态分布的洛伦兹曲线与基尼系数[J], 数量经济技术经济研究，第

2 期，2005

[4] 黄恒君，位置—尺度分布族的近似构造——以收入分布函数序列为例[J], 管理世界，第 3 期，2003

[5] Kakwani, Nanak C, On a class of poverty measures [J], Econometrics, Vol. 48, pp.: 761-766, 1980

[6] 庄健，张永光，基尼系数和中等收入群体比重的关联性分析[J], 数量经济技术经济研究，第 4 期，2007

[7] 陈孝新，基于多项式样条回归的基尼系数的算法[J], 科技广场，第 2 期, 2005

[8] Cheong K.S, An empirical comparison of a iterative functional forms for the Lorenz curve [J], Econometrics Letters, Vol.9, pp.:171-176

- 29 -

[9] Gastwirth J.L, The estimation of the Lorenz curve and Gini index [J], Review of Economics and Statistics, Vol. l54, pp.: 306-316, 1972

[10] Ogwang T and Rao U.L.G, Hybrid models of the Lorenz curve [J], Economics Letters, Vol. 69, pp.:39- 44, 2000

[11] Wang, Z.X., Y-K Ng, and R. Smyth, A general method for creating Lorenz curves. The Review of Income and Wealth Vol. 57, 561-582, 2011

[12] Foster, J.E, Wolfson, M.C, Polarization and the decline of the middle class: Canada and the

U.S [J], Journal of economic inequality, Vol. 8, pp.: 247-273, 2010

[13] 胡荣华, 夏德智等, 南京城市居民中等收入界定及分析, 地方经济社会发展研究[J], Vol. 1, 2006

[14] 庄健, 张永光, 基尼系数和中等收入群体比重的关联性分析[J], 数量经济技术经济研究, 第 4 期, 2007

模型建立过程.docx

420.17 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力 [记录]

zan

转播0 淘帖0 分享0 收藏0 支持0 反对0 微信

使用道具举报

返回列表

帐号		密码		只需要一步，快速开始		注册地址	找回密码

第十届研究生数学建模—新解读之模型的建立与求解

QQ

电话咨询

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务|

第十届研究生数学建模—新解读 之模型的建立与求解

QQ

电话咨询

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务|

第十届研究生数学建模—新解读之模型的建立与求解