数学建模社区-数学中国
标题:
数学建模方法——SPSS主成分分析法
[打印本页]
作者:
1047521767
时间:
2021-10-13 18:00
标题:
数学建模方法——SPSS主成分分析法
文章目录
- x9 n H1 y4 a2 Z& }
Ⅰ.主成分分析:
' ~6 O! X J O% s# W$ B
主成分与原始变量之间的关系:
* r' q- }9 M( W U
PCA降维:
& @1 H% o# m/ h" R0 J. A' R
Ⅱ.SPSS主成分分析的步骤如下:
% H4 R+ |$ i3 M
A.求指标对应的系数
+ S% E7 M1 ~$ Z! k. M
1.方差图与成分矩阵:
2 J( z1 V' F8 M- N
2.指标系数=成分矩阵中的数据/sqrt(主成分相对应的特征值)
# n( G) l8 e: [/ v" k# u6 I/ t
3.主成分的对应的系数=特征值方差的占比/所有特征值方差占比的总和
& ^1 {! i. r5 r0 R
4.采用excel的公式计算指标系数
* [. x: e/ m$ W) h5 m
5.数据的归一化处理
. ?3 G6 \7 ]8 w* z9 Z
a.操作如下:
6 L0 x' c0 d: b+ o. F4 t4 b3 M
b.得到归一化后的数据:
7 z0 |7 O( m2 x% I' N. Q/ F( W
c.然后将数据导入excel进行得分项的输出并排序:
! V$ D0 R( w+ n* D, \) }
B.附spss的免安装文件地址:
0 d$ {9 X; N* j5 E* W
Ⅰ.主成分分析:
! d& {" q$ g6 q. Y0 q; H
主成分分析(Principal Component Analysis,PCA), 将多个变量通过线性变换以选出较少个数重要变量的一种 多元统计分析方法。
% c: h7 N- V6 ?0 q! d* Q+ u
/ k9 N; x# Y0 R* V
主成分与原始变量之间的关系:
( X6 e( U l: I% e
(1)主成分保留了原始变量绝大多数信息。
8 M0 T- x# k) g8 t) [5 Z
; { x* S( N! J6 {8 d3 g z* ~
(2)主成分的个数大大少于原始变量的数目。
. t* o9 Y c) d, e# p, y0 o+ m
; f) D5 N1 g; c1 l
(3)各个主成分之间互不相关。
& y: W" T' \# v" [4 z: ?
' l# ] M2 D: s9 g8 o# \3 b- O* A
(4)每个主成分都是原始变量的线性组合。
' V, M% i( B; C3 z7 Z
1 v' Q: C( P4 q, o0 _
PCA降维:
! F; y7 g K. A% k. [
假设我们所讨论的实际问题中,有p个指标,我们把这 p个指标看作p个随机变量,记为X1,X2,…,Xp,主 成分分析就是要把这p个指标的问题,转变为讨论p个 指标的线性组合的问题,而这些新的指标F1,F2,…, Fk(k≤p),按照保留主要信息量的原则充分反映原指标 的信息,并且相互独立。
4 p" D; g- v' B: K8 U! G9 B1 z# d
& E& B N; M! n! y
这种由讨论多个指标降为少数几个综合指标的过程在 数学上就叫做降维。主成分分析通常的做法是,寻求 原指标的线性组合Fi。
0 D% w0 F( `0 V: S* i
, a7 \6 m: z- O/ U: A1 T
Ⅱ.SPSS主成分分析的步骤如下:
- S ^% l# _! E) g
+ z) a; v8 F7 y
q1 O; i3 j/ A) B! f
! s1 v6 i9 r6 s3 E7 O
8 K7 C4 C) k3 C7 W+ s
! e/ Y, }9 b$ l; c4 x
% O U. @3 a8 P# U) P
/ \8 u8 R4 L! b7 U4 T( j! f8 {
& G/ Y+ D% e4 T
* E, @; t V9 @$ X& {
, {+ X8 z) ?) i `0 Z1 t4 A: {
0 P+ {( I9 [( _
* {0 ~6 E/ R8 h
+ e0 A7 t7 g8 @- l; K8 t
5 `: p u$ d c# L+ x; B1 P
$ m: O1 K( c/ w+ S& I9 J, B+ J9 O
5 U( n& o0 q# `. c
! c' c K1 }& `4 W, t% u4 B1 P* Y
* j7 R8 v7 Q' i6 P, d
- `0 g8 l1 z2 w u
A.求指标对应的系数
1.方差图与成分矩阵:
- p$ ~/ Z0 Q! u) }# V$ q$ j
\9 v j# x* _5 ~1 u
9 X: m; d! B, e1 l6 \ o
5 }/ y9 { ]* z$ w1 `" c
2.指标系数=成分矩阵中的数据/sqrt(主成分相对应的特征值)
5 B+ y* n% w+ w; g# y
F1=0.353ZX1 +0.042ZX2- 0.041ZX3 +0.364ZX4 +0.367ZX5 +0.366ZX6 +0.352ZX7 +0.364ZX8 +0.298ZX9+0.355ZX10
7 ?. G! W+ c2 _; L# p. _# a7 \8 T
1 l7 }5 H V# O
F2 =0.175ZX1 - 0.741ZX2+0.609ZX3 - 0.004ZX4 +0.063ZX5- 0.061ZX6 - 0.022ZX7 +0.158ZX8 0.046ZX9 -0.115ZX10
9 W O" \% f$ W# Q1 |& }- c
8 }0 v, p( {, x( ~0 t E, k
(注:ZX1,ZX2,…ZX10均为归一化之后处理的数据,而不是原数据表格中的数值,目的在于统一不同的量纲。)
$ S' B, c! N8 ^) i
" k* G6 l5 o5 \ p' m
3.主成分的对应的系数=特征值方差的占比/所有特征值方差占比的总和
- w# G5 g6 z3 }
F=(72.2/84.5) F1 +(12.3/84.5) F2
$ J9 @/ f) O5 n: X. F7 R9 P
7 x% H& Q {" V5 W" a* c
4.采用excel的公式计算指标系数
# ]! a( ~! d- b4 l. x8 C# O$ c
将成分矩阵的数据列导入excel表格。
; [4 p' ^$ h' N6 @
& z! @4 k+ F4 e- F
) @6 B0 R, Z2 U$ T. i
然后通过Excel命令:
( F2 @! _! f* L8 g( `
=A1/sqrt(主成分的特征值)
得到结果:
8 z9 C6 x7 n% x2 X
* |" G) O& c3 Z/ O( g# q; r+ y$ I
, A' p: ]$ G( g0 ~0 Z
5.数据的归一化处理
a.操作如下:
0 A0 k0 d/ |: \: s1 o) R" t R$ T
, S/ v* V" V5 p
9 n, N# Q# j. A
- `1 z* g3 h; D9 q2 f
3 j# g5 H" X. D5 }0 g
b.得到归一化后的数据:
; u* L9 B9 o5 h0 v' D! n$ L
7 x$ O* q0 E8 b7 F, `* A0 z7 h6 I
/ f- b0 Y" \/ J) K& s/ {, t9 n
c.然后将数据导入excel进行得分项的输出并排序:
通过F1的计算公式得到F1标准下的测评得分。
# X/ d1 k) t. X1 A
0 v: r5 _! `5 ~) \/ V ~8 W3 T
F2同理可得;
最终根据F的计算式得到最终测评得分排序。
3 J" ~$ {) c; Z n; I
/ O2 N0 o" l9 P* }
! B' o/ c! K' ^4 u
) A/ ]2 x6 x3 A- D$ u2 f5 r' _ ^
+ q5 C: E% e f3 [ b" J
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5