数学建模社区-数学中国
标题:
数学建模方法——SPSS主成分分析法
[打印本页]
作者:
1047521767
时间:
2021-10-13 18:00
标题:
数学建模方法——SPSS主成分分析法
文章目录
( E3 j) Z5 w6 X) J' U
Ⅰ.主成分分析:
& \- `- P9 b9 Z
主成分与原始变量之间的关系:
5 V! _* o- y. m. W
PCA降维:
. z3 h: B; r7 ?7 R5 [8 L2 _2 u
Ⅱ.SPSS主成分分析的步骤如下:
/ u% I" n: }+ t) z3 t ?3 r. J
A.求指标对应的系数
. ^5 l! d. B9 o) _. D8 m
1.方差图与成分矩阵:
* ^' x. S g2 ~. I+ w
2.指标系数=成分矩阵中的数据/sqrt(主成分相对应的特征值)
5 S+ i* e7 U( Z/ C: \
3.主成分的对应的系数=特征值方差的占比/所有特征值方差占比的总和
. ?1 m- ~. | U) u* h( B# k
4.采用excel的公式计算指标系数
& h8 F1 `) C- G$ Q. \" e
5.数据的归一化处理
- h" ?( U) B& Y% p
a.操作如下:
2 Q' v, H5 ~$ j
b.得到归一化后的数据:
! k w( K" ]3 X ]
c.然后将数据导入excel进行得分项的输出并排序:
# y# T3 Q/ o; w
B.附spss的免安装文件地址:
, W! b0 n) z+ w& x. e" O
Ⅰ.主成分分析:
( t0 V( o' q9 `9 U; }
主成分分析(Principal Component Analysis,PCA), 将多个变量通过线性变换以选出较少个数重要变量的一种 多元统计分析方法。
( j/ [ |2 M% n2 e
2 H* V9 I3 G( q
主成分与原始变量之间的关系:
9 A; g7 u% t* Q* p8 y
(1)主成分保留了原始变量绝大多数信息。
/ F, U( r+ {6 `0 x
; H; a7 e' b: [. ^( g( b: ?
(2)主成分的个数大大少于原始变量的数目。
' S, l8 f* `$ G
% q* b1 n4 p3 x" {$ X2 }) A3 W4 K
(3)各个主成分之间互不相关。
. V. J6 R/ \. l& t a
( I6 r3 K( v& n8 e5 z# _
(4)每个主成分都是原始变量的线性组合。
- j T3 q+ R* m ^
! j9 M+ h/ U4 ^* @. @! i
PCA降维:
9 t' D; n3 ^9 G" O0 W
假设我们所讨论的实际问题中,有p个指标,我们把这 p个指标看作p个随机变量,记为X1,X2,…,Xp,主 成分分析就是要把这p个指标的问题,转变为讨论p个 指标的线性组合的问题,而这些新的指标F1,F2,…, Fk(k≤p),按照保留主要信息量的原则充分反映原指标 的信息,并且相互独立。
7 P# q! U6 z& \# S
! K' Q# z7 o7 r' ]
这种由讨论多个指标降为少数几个综合指标的过程在 数学上就叫做降维。主成分分析通常的做法是,寻求 原指标的线性组合Fi。
. Y( |2 e- r3 F2 i3 w2 n8 d
+ ]% C; o3 x- Y" J
Ⅱ.SPSS主成分分析的步骤如下:
& C5 F3 c1 M6 C# G, m8 ~+ r
& W0 Y; T2 `) v! T
( l8 `3 P5 _/ w/ h, V: ^
3 g a& O, C* ~& R- g7 v
# p" j+ ]. d+ ^" p1 l
$ k+ w* h) ]3 u8 z: t. J( O
" A* n) U9 M8 Q
, j1 c2 B' E. s5 Z$ d# v
! i" Z6 S- K* e7 [! g
9 K/ K& R, z! t: T5 W
5 X8 M' C8 R# e
7 m$ R+ d6 f9 P! K- Y; x
* [1 T$ P f$ T3 L& o: G; M
9 i: Y' Y1 V2 v8 o
% d3 l% T* R' \, a$ ^% O ?
# D6 _$ Q7 f! E
8 \, K/ ]# s" p* s
; g$ E& o+ `7 c& n( M+ R7 V: {- L7 ]: I
6 u2 Z; M+ a# Q( P# y
6 p% X2 d) K# F# r- ?" X8 A& N+ k
A.求指标对应的系数
1.方差图与成分矩阵:
2 _2 t( E4 t) n% I/ O5 {
) V9 d$ Y8 D& I
+ e- H* g& I# J/ p; \; w; `
( e3 k0 K/ J N. W+ s
2.指标系数=成分矩阵中的数据/sqrt(主成分相对应的特征值)
. p4 Z* X: ^& d" |5 d
F1=0.353ZX1 +0.042ZX2- 0.041ZX3 +0.364ZX4 +0.367ZX5 +0.366ZX6 +0.352ZX7 +0.364ZX8 +0.298ZX9+0.355ZX10
3 Z V8 O. v9 h& l3 ^1 `
2 k! }& m& p( p0 b0 E, ]
F2 =0.175ZX1 - 0.741ZX2+0.609ZX3 - 0.004ZX4 +0.063ZX5- 0.061ZX6 - 0.022ZX7 +0.158ZX8 0.046ZX9 -0.115ZX10
+ ?. p( O/ R5 ? s: v
9 k: k" K& ^* G
(注:ZX1,ZX2,…ZX10均为归一化之后处理的数据,而不是原数据表格中的数值,目的在于统一不同的量纲。)
9 b: b0 ?1 G& Z# Z* U+ ^0 Y
2 V( K8 |1 @, A7 d/ S* b ]% r
3.主成分的对应的系数=特征值方差的占比/所有特征值方差占比的总和
! l. Q0 C$ S7 \
F=(72.2/84.5) F1 +(12.3/84.5) F2
8 n0 p Q; ~* k9 U# a
5 k$ k! e- m5 z( n
4.采用excel的公式计算指标系数
$ o$ m: W* V! ~
将成分矩阵的数据列导入excel表格。
) Q7 ~( L/ O ]
`* N3 Y3 {8 d* v
" l, j5 x/ Y) d) Z
然后通过Excel命令:
+ a* u1 C/ D* T8 }6 z/ P
=A1/sqrt(主成分的特征值)
得到结果:
6 F" y4 {3 p; c; c6 ^0 N3 @" ?
# F1 j& N9 ]6 a# C/ @1 q
; X+ m/ A# p: `( E R. c
5.数据的归一化处理
a.操作如下:
2 \5 ~9 a7 |0 O! h
?- y8 j) L& [
% {5 c& M, e$ P$ [6 o" S4 y
# ^5 M5 r5 M1 x1 b, T
1 Y# L; G& G1 u, f( o) E" U
b.得到归一化后的数据:
+ V C6 i2 m; t! S
( p6 M" g8 R* P, G. q4 u& m p
) V, l1 N- _6 q# r/ Z
c.然后将数据导入excel进行得分项的输出并排序:
通过F1的计算公式得到F1标准下的测评得分。
# w% @5 R0 a6 z, C- Y% V( m
/ s: [( F" F4 ~; n' U( L0 h
F2同理可得;
最终根据F的计算式得到最终测评得分排序。
7 }6 `4 h/ ]9 c7 P! g
, k( K1 d+ @ Z" E
% R- b% N3 `% w8 ]
/ ?4 i/ Z* }$ N2 N. y' j
+ l+ x' G4 t9 ?& p2 p- |* Y& I
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5