- 在线时间
- 3 小时
- 最后登录
- 2012-9-10
- 注册时间
- 2012-8-29
- 听众数
- 5
- 收听数
- 0
- 能力
- 0 分
- 体力
- 41 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 20
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 14
- 主题
- 2
- 精华
- 0
- 分享
- 1
- 好友
- 5
升级   15.79% TA的每日心情 | 无聊 2012-9-10 01:32 |
|---|
签到天数: 4 天 [LV.2]偶尔看看I
- 自我介绍
- 我是理科生,对matlab很感兴趣,参加第二次数学建模
 群组: 学术交流B |
(二) 主成分回归分析
A 对自变量筛选后做主成分回归分析
在因子回归分析中采用逐步回归分析来选择变量,也可以利用主成分分析进行自变量的选择.文献[16]
对投入组六个自变量标准化后,根据做主成分分析选择进入回归模型的自变量.六个自变量的相关系数矩阵R可以看出变量之间高度相关.从多重共线性诊断也可以看到条件数K= 5.281/0.003=1760.333可以看出自变量之间存在较高的多重共线性.为了消除共线性,尝试运用主成分分析法筛选变量.用SAS程序对六个自变量的相关系数矩阵R做主成分分析,计算特征根见表15.
表15 六个自变量的相关系数矩阵R 的特征根表
序号 1 2 3 4 5 6
特征根 5.281 0.593 0.081 0.034 0.009 0.003
从表中可以看出最后一个特征根近似为零,该特征根对应的标准化特征向量为:
(0.110472, -0.237364, 0.824368, -0.200940, -0.459652, -0.014656)
由于特征根近似为零,表示该主成分对总体的贡献最小,在该特征根所对应的特征向量中第3个分量0.824368最大,说明在贡献最小的主成分中起主要作用的是x ,所以考虑剔除第3个变量.按照这个原则把特征向量中具有最大分量所对应的变量剔除掉,剔除一次做一次主成分分析,直到最后一个特征根不是很小为止.这样逐步把x ,x ,x ,x 剔除了.每剔除一个变量都对余下的投入变量作为变量子集分别对产出组各变量做多元回归分析,直到最后得变量x ,x 的二维变量子空间,对产出组中诸因变量做回归分析,所得回归方程中x ,x 的回归系数仍然有负值情况,而且与前面利用逐步回归分析剔除变量和典型相关分析所得结论完全不同,也不符合实际情况.说明主成分分析选择变量在本例的研究中是不合适的.因此仍采用上述的逐步回归分析的方法来选择自变量做主成分回归分析.具体做法如下:
的回归模型计算过程:
首先对变量 ,x ,x x ,x 的样本数据进行标准化处理,得x ,x x ,x 的相关系数矩阵R,利用SAS程序对R进行主成分分析,得R的特征值与特征向量见表16,表17.前2个特征值的累计方差贡献率已经达到99.36%,因此取前2个主成分足以反映x ,x x ,x 的几乎所有信息.得主成分关于标准化自变量 , , , 后的方程为:
=0.422642 +0.518834 +0.519233 +0.531585 (3.3.13)
=0.886671 -0.314812 -0.330249 -0.075121 (3.3.14)
表16 相关系数矩阵特征根
Eigenvalue Difference Proportion Cumulative
1 3.49748736 3.02071100 0.8744 0.8744
2 0.47677635 0.45788115 0.1192 0.9936
3 0.01889521 0.01205412 0.0047 0.9983
4 0.00684108 0.0017 1.0000
表17 特征向量
Prin1 Prin2 Prin3 Prin4
z1 0.422642 0.886671 0.122958 0.141666
z2 0.518834 -0.314812 0.758896 -0.236181
z3 0.519233 -0.330249 -0.260443 0.743978
z5 0.531585 -0.075121 -0.584061 -0.60880
对产出组中第一个标准化变量z (农业总产值)与两个主成分做逐步回归分析得标准化主成分回归方程:
z =0.506 -0.413 (3.3.15)
将式(3.3.13)与式(3.3.14)代入式(3.3.15)得标准化主成分回归方程:
z =-0.1523 +0.3925 +0.3991 +0.3 (3.3.16)
其中回归系数以 表示.
, i=1,2,3,5.
= .
其中 为一般线性回归方程的第i个偏回归系数, 为 的离差平方和, 为 的离差平方和. 为一般线性回归方程的常数.[17]还原回归方程,得 的主成分回归方程:
=1349.745+18.1886 +2.486 +0.9235 +1.558 (3.3.17)
其中 =110.967, =0.9688
同样方法可得产出组其他因变量的主成分回归方程:
=-33.611+1.2161 +0.0718 +0.0613 (3.3.18)
其中 =6.7504.8137, =0.8963
=-395.562+2.19 +0.1493 +0.055 +2.033 +0.1246
其中 =31.892, =0.8132 (3.3.19)
=1508.659-19.3916 +2.3835 +0.886 +
+1.4754 (3.3.20)
其中 =91.2346, =0.9749
=1789.738-21.5689 +2.9986 +1.1098 (3.3.21)
其中 =108.3834, =0.9621
|
zan
|