- 在线时间
- 514 小时
- 最后登录
- 2023-12-1
- 注册时间
- 2018-7-17
- 听众数
- 15
- 收听数
- 0
- 能力
- 0 分
- 体力
- 40054 点
- 威望
- 0 点
- 阅读权限
- 255
- 积分
- 12727
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1419
- 主题
- 1178
- 精华
- 0
- 分享
- 0
- 好友
- 15
TA的每日心情 | 开心 2023-7-31 10:17 |
---|
签到天数: 198 天 [LV.7]常住居民III
- 自我介绍
- 数学中国浅夏
 |
文章目录
$ h9 M, _& Y; N5 QⅠ.主成分分析:
0 B; m* {: c. B主成分与原始变量之间的关系:0 n% G% |1 s/ p1 H" @5 ?# `
PCA降维:3 q% y* }; q+ R! C
Ⅱ.SPSS主成分分析的步骤如下:: v5 C3 x( d( D. o8 H! N
A.求指标对应的系数
5 M- i! o- f" u+ y' O6 ^1.方差图与成分矩阵:6 P) W# w1 s' @, i, V
2.指标系数=成分矩阵中的数据/sqrt(主成分相对应的特征值), Q8 ^3 j5 \5 J% V: p
3.主成分的对应的系数=特征值方差的占比/所有特征值方差占比的总和
( N, i1 B7 V, J4.采用excel的公式计算指标系数6 A( D ?- b6 P' V# m4 ]
5.数据的归一化处理/ V0 N3 C1 R8 o/ O6 `
a.操作如下: G% x2 @* g; j' J1 O1 w# X
b.得到归一化后的数据:
$ }+ ^2 {& A- T# Cc.然后将数据导入excel进行得分项的输出并排序:" X, _) d3 g5 R/ g# X% v
B.附spss的免安装文件地址:
+ z, ]+ `! x3 b6 g5 _, N' k3 RⅠ.主成分分析:
5 {$ u8 n% O9 H% r 主成分分析(Principal Component Analysis,PCA), 将多个变量通过线性变换以选出较少个数重要变量的一种 多元统计分析方法。/ |! M% f% m0 E' x
f& p- g. |! D" {主成分与原始变量之间的关系:
! [0 I$ z6 Y& S2 t (1)主成分保留了原始变量绝大多数信息。
1 s( j* j1 i9 x5 ~8 g7 T9 B
* t! s" {. u3 n* u+ R (2)主成分的个数大大少于原始变量的数目。
7 N. S& c5 l& g& ?: P. K F c; X
; R& O2 n ~7 x0 P$ D( r (3)各个主成分之间互不相关。* W2 c2 q8 g5 R! q* U
# P3 S* L% l* Q# M# @4 o (4)每个主成分都是原始变量的线性组合。' d Y& A1 I o5 P+ F+ s C+ r
6 @& O9 _& Q' U, _% g8 U7 \7 i+ \PCA降维:4 Z @- x' y; y6 u; `
假设我们所讨论的实际问题中,有p个指标,我们把这 p个指标看作p个随机变量,记为X1,X2,…,Xp,主 成分分析就是要把这p个指标的问题,转变为讨论p个 指标的线性组合的问题,而这些新的指标F1,F2,…, Fk(k≤p),按照保留主要信息量的原则充分反映原指标 的信息,并且相互独立。
X9 M/ B3 S% K
! Y/ w, a1 n/ V, ~% t* t 这种由讨论多个指标降为少数几个综合指标的过程在 数学上就叫做降维。主成分分析通常的做法是,寻求 原指标的线性组合Fi。
4 Q4 I! p4 ^/ B
' N3 u2 x3 l4 l, p) j" EⅡ.SPSS主成分分析的步骤如下:% q/ F4 ~$ m6 S1 w- d8 r: r' f
3 ]3 L- r( J( ~![]()
9 Z- B2 }* l0 m" A4 V% y
% d" L9 n/ x$ a3 }4 I1 W0 I) K % T$ w, ^4 {* I9 n/ R6 Y* j# k
9 y/ e! E, m, f) X( g( w W' _ . x1 _' G- {2 n6 W
/ y) d0 _% o$ X& p
![]()
! O! Z x4 a, E+ f2 l; z' R `( V Q# i+ A
# T: {5 _1 `6 _7 i
; ^; J. _2 X" u) `
4 U! _* Y/ h+ |# \( L2 [ g# g
j- J3 P& K; H& Y# _
![]()
# _$ @* W* i4 U) ?* v/ D( N4 A
8 C2 u; |# b! d* }- g/ J" I) l7 r u! s( q
![]()
* X1 ^ @8 t4 D+ Y, Y# v
/ |- C, C( j( ~. w# p' o, Z4 _) H' v' L- w
A.求指标对应的系数1.方差图与成分矩阵:9 W9 Z7 Q: O. l7 Q6 v9 l: Y& {( p
* G6 O; s5 N/ b5 `) K4 I
+ t7 X* w4 `, A ^& j
8 a% V5 o8 ], I0 a# l6 T2.指标系数=成分矩阵中的数据/sqrt(主成分相对应的特征值)
( _: \' d( u* E! p4 T5 r5 MF1=0.353ZX1 +0.042ZX2- 0.041ZX3 +0.364ZX4 +0.367ZX5 +0.366ZX6 +0.352ZX7 +0.364ZX8 +0.298ZX9+0.355ZX10 u; v; M/ x! W! ?) c
, u5 U$ H, v5 QF2 =0.175ZX1 - 0.741ZX2+0.609ZX3 - 0.004ZX4 +0.063ZX5- 0.061ZX6 - 0.022ZX7 +0.158ZX8 0.046ZX9 -0.115ZX10
2 H8 }* |5 ^: d- k8 }/ }' O$ q& l) N0 _) ~0 _, v3 K/ r
(注:ZX1,ZX2,…ZX10均为归一化之后处理的数据,而不是原数据表格中的数值,目的在于统一不同的量纲。) h3 ~4 h$ b, k' u
7 {9 Q g* Q3 O& a
3.主成分的对应的系数=特征值方差的占比/所有特征值方差占比的总和' l. B8 P; g4 O2 E& r3 F- f: X
F=(72.2/84.5) F1 +(12.3/84.5) F2
1 j3 Y' Z4 |) v+ R3 B! `" j7 J' G6 r+ D; L
4.采用excel的公式计算指标系数
$ A# x$ \4 P% P J7 z将成分矩阵的数据列导入excel表格。
& e) s% O% y; d2 ~ ^6 b% x![]()
+ T! U5 u/ Q5 K! ]. F# k- A/ @; k; K1 n
然后通过Excel命令:
2 J2 c. V5 k9 J; q' S =A1/sqrt(主成分的特征值) 得到结果:
7 t- D" V! y5 v: ^![]()
- z) l0 M+ G( {- r1 A1 J d
* j9 t! D4 y2 J$ G5.数据的归一化处理a.操作如下:
% o3 k# W7 t7 R _![]()
. R! H: W# }+ T/ O
3 {# _- a* e# J8 A![]()
1 d6 j. T7 l8 {9 `( |7 T0 B. ` M1 [1 f. E0 X* c- N2 j3 v4 A: ]
b.得到归一化后的数据:
2 p' a' N: O9 U![]()
) w# w+ H- w- q9 H. j+ D% W2 _, u8 l
c.然后将数据导入excel进行得分项的输出并排序: 通过F1的计算公式得到F1标准下的测评得分。 ![]()
& L! v: c- G- K* J! ~
/ L- F( R" E4 n; |5 K* aF2同理可得; 最终根据F的计算式得到最终测评得分排序。
- a8 @2 ^3 N" {$ t0 j ' v0 ^4 j0 L5 ]3 w/ R5 x
2 x9 B( }& ~1 d
& x: |' A. b' y4 D/ ^8 _# A$ A
# n( ~+ [* e9 ?) U |
zan
|