数学建模社区-数学中国
标题:
数学建模方法——SPSS主成分分析法
[打印本页]
作者:
1047521767
时间:
2021-10-13 18:00
标题:
数学建模方法——SPSS主成分分析法
文章目录
6 T. ~' M# b! q" ^: D7 m/ o! T
Ⅰ.主成分分析:
; J1 r$ d2 C, D( k2 `& Q
主成分与原始变量之间的关系:
7 v- G1 ^! M# r, t+ f5 p# s
PCA降维:
9 s0 J9 h/ p( e; N! k% z, B5 [" f
Ⅱ.SPSS主成分分析的步骤如下:
& V- v" v8 b& K4 c, g/ N
A.求指标对应的系数
% b% b1 Y$ Y; e7 F3 t
1.方差图与成分矩阵:
! h+ a/ T3 F6 R$ g( S
2.指标系数=成分矩阵中的数据/sqrt(主成分相对应的特征值)
( ]. @/ _0 ~* L g" K
3.主成分的对应的系数=特征值方差的占比/所有特征值方差占比的总和
( t( Q. w# U' K6 M2 n4 |; b: N5 m
4.采用excel的公式计算指标系数
5 O5 J$ K4 j% y" v- w
5.数据的归一化处理
- j' B# t% t) k4 A
a.操作如下:
+ e, P, E5 F4 U; K
b.得到归一化后的数据:
7 L2 _! u7 }( S" A7 r
c.然后将数据导入excel进行得分项的输出并排序:
0 P! r, ]$ f" B5 {( `
B.附spss的免安装文件地址:
+ c7 ]/ B4 x$ O& |# _7 a; Y
Ⅰ.主成分分析:
6 D: b5 Q8 h: F: l) _* S' b
主成分分析(Principal Component Analysis,PCA), 将多个变量通过线性变换以选出较少个数重要变量的一种 多元统计分析方法。
, Z' J3 Q G5 U" g: Y+ Y4 Y
9 P+ W) P; `; e+ o( ]
主成分与原始变量之间的关系:
8 Y5 b3 l* |- J' O. g
(1)主成分保留了原始变量绝大多数信息。
$ h) C' s. y" b2 Y- k+ G- z% D. l* V
; x5 i! K0 b' s8 {0 t. z" k
(2)主成分的个数大大少于原始变量的数目。
5 p& G3 i7 p; _5 B
1 ~6 y) D' Q) q9 \: [
(3)各个主成分之间互不相关。
4 p3 ^3 h8 c# ]. G! l
# B3 F# V4 |6 B
(4)每个主成分都是原始变量的线性组合。
! I! R- B+ _6 y' _/ N2 }( X
5 N/ h4 V2 @+ Z9 W; l% ?0 r
PCA降维:
9 ?- N. \- U' y$ X
假设我们所讨论的实际问题中,有p个指标,我们把这 p个指标看作p个随机变量,记为X1,X2,…,Xp,主 成分分析就是要把这p个指标的问题,转变为讨论p个 指标的线性组合的问题,而这些新的指标F1,F2,…, Fk(k≤p),按照保留主要信息量的原则充分反映原指标 的信息,并且相互独立。
6 E! r4 {* i/ m. L; O( \
1 g: r3 ^8 a- A9 R
这种由讨论多个指标降为少数几个综合指标的过程在 数学上就叫做降维。主成分分析通常的做法是,寻求 原指标的线性组合Fi。
, n( @% ^$ j& A8 [* p: {) H9 h) [3 H
- x) J- F/ r* g
Ⅱ.SPSS主成分分析的步骤如下:
( C! g% g/ P) w) {9 I! n
) ]; t5 b" {5 _/ ^; b# n
, S7 r( j& e X! t8 C( u
: R0 |% X ]* w* M1 V3 ^( t) x5 @' w
6 i. `- f! w' `5 z
( u e1 H' c% ~9 b) h
m4 n: N( Y+ b* L! p* Z. e
& Z; O, M) G# Z9 a& R
5 L8 l: u# g0 z; j- C. g
4 h4 y2 ~+ `5 R4 d6 s
1 v2 Y; Y' Y3 Q+ E3 I
3 N& x8 M. W6 x, \2 J& y) R
+ d" c+ V' q/ f
8 E' m1 Z) H) S3 r% @0 [) q
3 F: D6 g* V. o6 _# k: z
6 ], F9 w: x% T$ d8 X& E
7 w: o! g: S8 F/ b
* h& h, ^! ]. l# k2 X u7 H
0 Z+ o: |" ^$ @7 L5 h
! n$ {7 t( |; u0 v4 e6 c( u
A.求指标对应的系数
1.方差图与成分矩阵:
, `# m [3 Y" k V: T
% w# y) E5 w6 A, b
& w' T+ ^, j: X( l8 F& E- D! Z
G* G+ ?8 n% V' y
2.指标系数=成分矩阵中的数据/sqrt(主成分相对应的特征值)
% }' @4 s5 b2 O5 h
F1=0.353ZX1 +0.042ZX2- 0.041ZX3 +0.364ZX4 +0.367ZX5 +0.366ZX6 +0.352ZX7 +0.364ZX8 +0.298ZX9+0.355ZX10
2 ^1 q6 b7 z$ O; J
, Y7 a- I; z7 z: Z f
F2 =0.175ZX1 - 0.741ZX2+0.609ZX3 - 0.004ZX4 +0.063ZX5- 0.061ZX6 - 0.022ZX7 +0.158ZX8 0.046ZX9 -0.115ZX10
8 o! p- g& R7 D0 ~4 G
2 p9 W* i; a- b W
(注:ZX1,ZX2,…ZX10均为归一化之后处理的数据,而不是原数据表格中的数值,目的在于统一不同的量纲。)
w6 Y2 e; O, N; j
" v' e9 T2 m, h0 w
3.主成分的对应的系数=特征值方差的占比/所有特征值方差占比的总和
0 |2 T% ?& m3 T. H+ H
F=(72.2/84.5) F1 +(12.3/84.5) F2
5 _+ D5 e) H- E$ d9 b
! D& g3 a# c% Y2 D6 z# ] b% k
4.采用excel的公式计算指标系数
7 \7 N1 J- J9 u; O4 k2 B @! I
将成分矩阵的数据列导入excel表格。
/ T E: j+ L) Q. [
% N" @2 E" c6 B1 I# R# ~! u' B
- y5 m# A$ \/ U% O$ \5 t
然后通过Excel命令:
8 O5 l" f M# }. t; U) b" W/ L
=A1/sqrt(主成分的特征值)
得到结果:
& @& V4 A: q! c F* o
- Q3 N* e- M# t/ X9 I
3 _. s; R! q$ ]$ R$ B
5.数据的归一化处理
a.操作如下:
0 A; C' ]# ~: ]1 i5 R8 h0 J
: e1 @. Q7 P; a9 w1 t; p# R
0 @# k1 F0 O5 @$ p1 k1 ^
: i. [* H$ u& J8 t1 j+ w
' ?9 Q+ H% S/ M/ T) V
b.得到归一化后的数据:
. e( ^3 |; c! s- z
+ _6 H# X' _ L% l1 R" w
0 ^5 x( t2 u$ z8 z
c.然后将数据导入excel进行得分项的输出并排序:
通过F1的计算公式得到F1标准下的测评得分。
# ^. R5 @) O" R8 h7 Z0 H
% i. `6 c2 [: `& W% @8 E4 z4 o) B
F2同理可得;
最终根据F的计算式得到最终测评得分排序。
# \) g" @. C# \2 u' ^7 S
3 I9 `+ l1 R' R4 u {# u. \6 ^
+ a3 d) t; v+ U# F# d4 S/ T0 P
/ A/ D& ?9 y7 I# Y
2 a) i, O* D" i- m _7 J
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5