1 L% I4 w. c& a" Yn=1* w6 S G* g6 l) _" X. u& ]8 C
∑ : l! d; P# Z8 V, b& `1 ?1 t* I n% d8 f% T8 j3 F: P# w4 o
w 8 b6 s/ n! Q/ Zmn* e# e+ h4 M& J3 S D; c
9 w( w, D- Q1 ^: O$ [ (h . L% s% d- n" y' D
im 9 E! w2 M" `3 n0 @0 z# h$ @ 3 T3 d1 X4 G1 Z L& @ −h - `! |& u; Y. B. y
in2 L9 T# H( T1 d' S( D
! H3 Y8 x8 ^( A$ X8 \4 F5 [6 y8 O ) : r y) X' d+ A3 u
2" ^5 M" E$ x' L; L
= * J! r, j1 i' F
∣A * K# i. T2 f- C; k! |6 Gi0 B' c- p0 q" F3 _' v9 c
0 c+ G. I& a2 m" C, i9 m5 o: |( { ∣6 y ]9 H0 [+ j' g
cut(A ' P9 Y* _# D; K/ @. d& v
i5 E/ O& d$ D% L4 \
: Y6 `1 ~" J; O* E9 [5 `& i. V% A' m% h
, : |& i! S! l% l, ]A! i/ z; D5 [" ?& v8 a G
ˉ4 }! E6 f; c$ _: {" T3 v
0 }$ w2 g* K: s$ H0 ^( ]- e: J6 ei7 H; Y4 x' c" L$ x
# ]( [! G9 r! W/ b
) ]4 p$ w. Y1 o2 S' e+ p1 `, A4 S: K( N7 M2 a) b; \7 O4 w" ?0 _9 Q
4 }* p% N& a9 M1 Q* S. k" F9 T! F3 l8 J; L5 `# V+ I
严格证明过程请看刘建平博客:链接 . L9 g0 S, {" R& W( _$ u可以看到,对于某一个子图i ii,R a t i o n C u t RationCutRationCut就对应于h i T L h i h_{i}^{T}Lh_{i}h . E' @. z( |- Z2 B$ H/ F) Y
i ( L U& i5 S' Z- e0 IT ( F/ ]; k' A. x. s' O/ g2 ^6 j" w$ r 0 A) Z5 c2 G$ J Lh 1 o/ p$ z3 V- H) C5 p
i$ ^& W' a/ i# p$ C% Z% M1 b X B
0 m/ z$ S5 ^& Y" A! B# b3 l/ `+ M: v \ ,那么对于k kk个子图 9 R3 {6 @$ F- o. ]4 Y6 j5 {( N 3 z5 z1 V) D4 t/ FR a t i o C u t ( A 1 , A 2 , . . . , A k ) = ∑ i = 1 k h i T L h i = ∑ i = 1 k ( H T L H ) i i = t r ( H T L H ) RatioCut(A_{1},A_{2},...,A_{k})=\sum\limits_{i=1}^{k}h_{i}^{T}Lh_{i}=\sum\limits_{i=1}^{k}(H^{T}LH)_{ii}=tr(H^{T}LH)7 _7 K/ B; j( g3 q
RatioCut(A t* \6 ^: c; ?3 c! ^8 s$ @% p9 T) ]1 5 [! |$ j% n# O: j6 p; A9 A! {2 D' c* q
,A 8 y) t: J9 W9 F8 X: _ g
24 K. p4 h7 u9 n$ r0 G
' h- l. ~6 v n4 N/ ?5 D! `5 q ,...,A 3 t2 M. ]7 b- }+ R8 v
k ' p1 T$ ^( q7 |% I' x# k" Z' A ' t: F: c7 m% Y6 H* L T )= : }" j: F$ \, B4 B% I6 y) P
i=1 . D% w$ H7 ^7 C* a, i, ~∑) D1 M' z3 j0 r
k + S+ Y( ]' X5 O F3 X' Y+ \/ F : c1 r; ~! }/ _- r% Y h - L: G, H3 M4 u# \* ?
i ! y( z5 o7 N) o Q+ A$ jT3 L. ?. t6 r; v% V3 g
: t* ~9 M2 `+ u q' u, Z3 x5 g
Lh 4 g' S) P3 y* t2 ^i 5 B) x! }# e, t/ ]3 O8 K2 H% P' e: P% q) o
= - r* V. L9 ]. \. j: d+ c( }* |1 Ii=1. i* A6 S3 z# [+ K$ U
∑7 \3 I2 J" F$ b* |9 Y) _& h
k " x' W$ d8 L4 J! i : \5 b! j; E& c3 t j (H $ }% e$ c$ B% u; W* J! Y8 o
T " v1 t5 e5 M; u9 h+ H/ K LH) $ D1 Y0 q. f( @/ ^, u" S) l. u
ii ( r5 d# c8 j5 k) a ) y5 G7 h4 M; C. E& N6 |4 I =tr(H $ b3 k' e5 ` {0 k0 Y1 U) JT ( X! k1 o1 d( o& O/ E LH); n' E( R. Q' w4 |4 Z
- T A4 o0 I3 e8 y
因此,R a t i o n C u t RationCutRationCut切图本质就是最小化t r ( H T L H ) tr(H^{T}LH)tr(H 4 W1 |$ q: \" T& L8 V$ N- Y
T1 w3 E( X+ b8 K, |- G% Y( ^
LH)。又因为H T H = I H^{T}H=IH 4 ]! |& B1 h' N. eT 4 Z4 k. H3 W; L4 H" D# Q% X( ? H=I(单位矩阵),则切图优化目标为 5 J9 n8 T' H+ p8 A+ k* A$ g1 ] / D6 r8 `0 d% |$ j3 Z5 ya r g m i n ⏟ H t r ( H T L H ) s . t . H T H = I \underbrace{argmin}_{H} tr(H^{T}LH) s.t.H^{T}H=I$ N9 A0 A4 X; \% O
H . V7 ~% e8 w( u- E2 a) q; L$ I6 {argmin" ]* }$ a) u9 E- A: ~0 |
1 `3 k) o& m- }: u) ?& [
: ~5 ^( V/ S! V
4 [% l. F+ v8 Q( E) D0 [ tr(H # J+ ?* C. L' d! H& L9 H* w, B
T % Q0 D( T* c* y LH)s.t.H / s5 V$ D8 X( ~0 f, RT ( C8 {3 F$ i6 a& n" h3 u( A H=I 2 f% z) Z# O6 E* Z; h2 J3 k7 r0 l3 d! U J7 O. T5 b$ m
对于优化目标t r ( H t L H ) tr(H^{t}LH)tr(H & G' w u# B t9 {6 {) {
t* e+ u2 W. |! N+ k5 b- j; H
LH)中的每一个优化子目标h i T L h i h_{i}^{T}Lh_{i}h ( c9 c* m4 v8 K: G+ |' ` v, qi* I8 ` f9 ]9 l { [* a
T % n8 g* b5 C4 Q$ j 9 Q; }! u: D1 P" Q- @) U Lh F; P( }, F$ _4 |
i - }. u; ~0 e7 ^0 A ; m0 R/ `3 P& v E) g- F! q ,其中的h hh是单位正交基,L LL为对称矩阵,所以此时h i T L h i h_{i}^{T}Lh_{i}h , Z# [2 A7 R) z; T( Z- Hi 9 \+ p0 `1 J: _; JT 9 K9 `! ^( o& l9 l. M( y 8 ?2 ]8 z. K. z; I Lh : Z8 O7 \0 n# {/ I5 d8 |i + h( R2 K( N& z5 L) v9 V. s 9 M! P9 _ @3 ]& x& K X 的最大值即为L LL的最大特征值、最小值即为L LL的最小特征值。而在谱聚类中,我们的目标就是要找到目标的最小特征值,得到对应特征值向量,此时切图效果最佳。所以对于h i T L h i h_{i}^{T}Lh_{i}h 7 y: Q' ^& N) B% \6 u( ~" bi* G% f9 H7 C. D$ r% Y
T 5 O6 G5 W# o. x' l6 R" J 5 S( n: h8 m2 c% | {/ C Lh 2 q" H2 O4 o2 ^+ ?* K- Ki + W& U4 X8 r$ u# N8 w8 w- e' `5 p) U% ^5 v' d7 c2 o: T& ]
,目标就是找到L LL的最小特征值,而对于t r ( H t L H ) = ∑ i = 1 k h i T L h i tr(H^{t}LH)=\sum\limits_{i=1}^{k}h_{i}^{T}Lh_{i}tr(H / ^1 ?; `/ X, P3 U
t : q p H& ] g0 J) o LH)= 0 |7 I' y4 q$ w( p. N) {
i=15 A" w0 J- W" g4 T, Q+ S& Q
∑ 5 o, C$ _, ?; `/ lk+ ]1 ^" E0 ?( R& u. ^! u$ Z8 v- @
+ \9 A3 l( c1 V8 V/ p4 O% C' b0 K
h ' [# P- m) Q1 j
i ; |( E# c" d) q GT , @) ?0 K7 x& C. U! p% W * u. [1 ?3 K, b' n9 B: S Lh # h+ | e2 \) o# V9 R; qi1 a7 u3 A2 E" s' {
3 E! o% A& k6 y) _# W h ,则目标就是要找到k kk个最小的特征值! q# o, o: g8 E J1 S9 V
7 I! z1 h7 [4 B
因此,通过找到L LL的最小的k kk个特征值,可以得到对应的k kk个特征向量,这k kk特特征向量组成一个n nn×k kk维矩阵,也即H HH。一般需要对矩阵H HH按行做标准化,如下* c1 V0 ?; L( V
: Y/ i$ |- Y' x! g
一般来说,k kk远小于n nn,也就说进行了降维- [: E3 i; v0 b. }) c G
h i j ∗ = h i j ( ∑ t = 1 k h i t 2 ) 1 2 h_{ij}^{*}=\frac{h_{ij}}{(\sum\limits_{t=1}^{k}h_{it}^2)^{\frac{1}{2}}}1 G* `5 B: b* j8 z5 M* ?
h ( e: I4 o* Y6 y D; U0 a; ~
ij+ F5 I) j$ ]1 Y0 y) x1 d. X
∗2 A5 V9 K" p( B0 r" @
, t5 k; Y# \3 _5 p0 m1 q = ! g' D+ y$ s( t$ ^( ( \2 o. |/ V0 _( ft=18 x7 `" g7 d9 V
∑) `5 t; b2 W/ f% e
k( r( H! U( }# l$ U' @7 y7 X
2 M7 {( T8 J/ A# }3 }- @1 e h ) m) A% D2 g5 ?! a# E4 B. `it' G% m3 W, p$ o$ I! ~! }
2 2 V5 F0 Q( v. G6 C& _, j# N( A3 Z$ N1 s9 q. m+ ~2 U
) 5 f, L, d4 ]! d+ x$ n8 J2 1 H9 L" _( m6 J" |$ r1* e0 I0 ]: g$ T6 W
* h8 L( k2 r- Q3 _( p" F3 p; {4 g4 t: h) B' V0 p
% j3 a K) u+ O0 R; P) A+ ? ^
h . v5 S6 S, B, H
ij ?+ W, a2 \( k6 L) B7 W1 m: a
' s4 }* ~" W" o: ~, ]+ B : K) w, p2 L/ B" ~/ \; `' E, G6 R - \; y: R& E8 @" \ I. R& O0 |. @4 Z; `
; _5 H: x. R K/ i2 K9 _. U
这里需要注意,降维后导致得到的指示向量h hh对应的H HH现在并不能完全指示各样本的归属,因此一般在得到n × k n×kn×k维的矩阵H HH后还需要对每一行进行一次传统的聚类,比如使用K-Means聚类5 x0 y! y$ n" R/ u* h9 W7 H4 r
7 U9 H8 r2 D( k$ ~0 L(2)规范割(常用) 2 h; U; q" z6 F: C3 A规范割和比例割类似,只是把比例割的分母∣ A i ∣ |A_{i}|∣A 2 g1 j+ |" @4 ~, B1 Z1 ~, S7 N G1 A4 X2 Yi ) p$ |0 l. J# a: d' r8 f" z* j4 Y6 j% B7 J/ r& R- R0 l
∣换成了v o l ( A i ) vol(A_{i})vol(A * A% v; a9 ^4 A, }7 E& I9 Ji 4 s- L( ]% R: b: @( Z * K: T$ l( d* r# l: {8 p! b ),定义指示向量h i j h_{ij}h & [5 k' Q" g: z! L
ij , [# p: z8 R1 n, P+ _4 q6 m$ {4 A6 b/ G/ K, f5 W
如下 1 ]' s- N" d# B! V- p! A+ l2 V: d e$ i0 A: N1 ]
h i j = { 0 , v i ∉ A j v o l ( A i ) , v i ∈ A j h_{ij}= z# x8 v$ c: r" r
{0,vi∉Ajvol(Ai)−−−−−−√,vi∈Aj " u$ C* w( W- N, F, A1 R: w{0,vi∉Ajvol(Ai),vi∈Aj : C p, i/ A6 m' e5 Sh : ], f" f5 d2 ~: [! S& z
ij- D; ^5 n. q: M& f# `" I6 l. M+ ?
: ^" C$ p" q. ^$ q' o$ f8 U ={ 9 H, M4 W8 _6 S6 T& j( o0,v , _2 u; g8 B. T! G9 F, Ci7 ~% @; v. H) r h/ h% n
" d4 a- l$ n' Z: A; _# [2 X/ |% n
∈1 |7 J+ W+ U+ d' ?$ o4 x
/; a- l" N! A) |7 c; K+ p
A $ C( d$ g" G! n8 w
j9 J( N/ C9 D/ O6 A
, O3 x5 |, {* I, _, K1 l ' a! n3 i, l, Z0 Y- hvol(A & Y, g. Q/ V. i0 M; Q% j2 li; a, n( Y+ c( v0 [3 O* C
; Z }; M z9 j: t: E- e- C
) 5 x- D( m& \! d8 E) ` 3 ~7 F$ V1 S- K ,v , V$ U6 L5 y) {. {. h3 O6 Di ! J+ a! S( ^ D1 q6 O6 b 4 ~+ f6 x* i% w8 U ∈A ; @) w G1 B1 b# E5 [0 I" O6 _j1 T Z3 f/ w: _! |, J& B1 R
% H/ a, t! i& s( F1 r! W7 x/ r- L) ^" c' k
8 V3 a, a1 E! u8 b$ t/ k1 f; G
+ u2 q N0 N' q于是,对于h i T L h i h_{i}^{T}Lh_{i}h ' l0 w: q; `4 t8 D6 K5 l
i , U. o. V8 X& R% }: a' HT) Y( i$ ]# M! ]3 ]5 l
" A4 s, ?' ^- ` Lh ! Y% B7 X( i) v- x" M1 u' |0 \i) @0 W: k: a H( j/ d0 {( a# y
( l# z" @! e$ s' n) L2 s; n8 b
,根据拉普拉斯矩阵性质可知 2 Y2 i5 r, L+ m ( k- ^4 K- o2 L6 y" F对于任意向量f = ( f 1 , . . . , f n ) T ∈ R n f=(f_{1},...,f_{n})^{T} \in R^{n}f=(f 5 n& w/ ^1 l, U; s- }* }/ @$ e R15 A7 D; R& X! L1 F# m
9 l' B' n+ }* o' K4 N A
,...,f 8 }' O0 n$ ^8 U9 d
n' g9 _# l$ X9 D6 z
* S) \3 _7 \$ g g8 E# f ) ; W/ n9 f3 I- b) P0 J8 e: pT * a/ w7 ^) D9 J, R; s, g; j4 B( u ∈R ' a6 J# S) k0 N/ }7 q9 u
n$ @( `& x# `$ w- D G
,有f T L f = 1 2 ∑ i , j = 1 n w i j ( f i − f j ) 2 f^{T}Lf=\frac{1}{2}\sum\limits_{i,j=1}^{n}w_{ij}(f_{i}-f_{j})^{2}f 3 w6 Z+ [# t( ~- }# uT 3 r# Z8 b! E @% {) ?' g2 j Lf= 1 [5 J, U& X; G, M2 7 j- Z2 `8 R2 J, ^' n; v6 e L1 : H! P' g6 V- M' g( S% Y& p; q$ u/ H8 {' Z+ q7 H. D o& E" d2 u; D
0 D; e0 K. i3 C% y$ d
i,j=1 2 M# c# Z' S9 t B( w+ H I. r ]- H∑ * d/ ?: x1 l" }0 J- r1 Tn/ h8 L! U4 u X* \' c
0 l8 W- i5 s9 |9 p4 k# A w / y0 K% `) G: j/ X, w
ij ; g% \1 V: C; I1 `2 O% O1 Q7 L5 c% N4 M& Q6 t
(f " c6 \* v) R' { G& Wi 8 p! w! w7 K3 _& y; H4 C4 T+ x1 j. p) _2 R6 e
−f 3 _* `, ] g2 G2 M' T0 e3 Tj R. c. J+ R) u1 `
. z5 H; C1 u( a0 P( _2 S ) ! c; E2 s# |, n7 P$ x
2( S2 Y% ] Y; o6 t$ p. h
g. l/ F$ W! k1 }
h i T L h i = 1 2 ∑ m = 1 ∑ n = 1 w m n ( h i m − h i n ) 2 = c u t ( A i , A ˉ i ) v o l ( A i ) h_{i}^{T}Lh_{i}=\frac{1}{2}\sum\limits_{m=1}\sum\limits_{n=1}w_{mn}(h_{im}-h_{in})^{2}=\frac{cut(A_{i},\bar A_{i})}{vol(A_{i})}4 v; H% U: B8 o# O
h * n5 D9 p! J$ ]/ w& P. P/ ~8 k
i: a. Q. W- m Z; D) e
T " I7 P& d! k- g. y 3 h0 m# Z& k; S- ^# c1 b Lh ; J1 b* s& `7 k" Ui 5 e$ D2 Y2 }, U( j1 L1 P$ R* P$ D! D$ }! }
= # ]1 ]6 Z; k6 z7 v/ G+ p- z0 Y5 l2) T' T% _+ E7 d( V M3 j& R/ W8 i, }
1 # v# X3 i) P" K& \. J4 ?3 u0 D E% w/ [2 I; v
+ L' S7 i/ i6 u- [- `& om=1# M; x7 P' S$ T: a
∑$ l* m5 F# _1 Y
% ^ k0 o0 A) w
+ i' }: s/ U% f; C3 Bn=1 / [/ ?# V4 ^5 H# T1 ]& a∑1 m9 K1 z( W4 d! s% s3 X& V
8 c. L5 Q# |6 ]
w / E; T# w" d# _, w; ?mn$ |% E, j+ S7 ^; Z" S: P3 y/ u
2 k# R( j/ a, X( ?1 p0 u( C6 L+ _9 M (h B& y5 g% j7 Wim ) n9 ^, i/ v" w: a9 E M% u; u4 n- x- X# q) h −h * V: ^5 h# c+ t+ H6 p
in & K7 [1 D" l P4 D6 C: \- o5 b8 Q6 k( ~3 t. W( ?
) $ D( z6 ? ~5 z; P; c& G0 W% ?2 ) f( |" U8 N9 h W = ) Q4 |; Z" B4 \8 l9 \& z% L" K
vol(A - u/ u* w4 v+ `& p6 Ei0 e0 A& t, I# j0 W* R* T5 M$ G8 _
. c( Y) Z: F& i4 c& {! S ) 3 C3 K6 D: ?% {6 N& C, k( A: Kcut(A : A% B1 ~" j( ?2 [2 Q. V- {
i - N5 ^ v) k/ T$ H! M! {* T) Z* I4 o4 q1 b, a* p% b
, 3 H( r1 h1 O0 D3 ?% m4 I% q' {* VA4 K" [8 X4 v: D' b3 g
ˉ7 l7 T0 I9 N2 t$ s
4 D9 o) }% k. O. w, {
i . \. [1 d1 }3 F- {- i |" `$ N: \! `- g- ?5 p* R
) * B4 p' S' s! v( J3 l" p9 q9 K' o# T) e* M8 V4 f% j, r/ Y
8 K8 k" r/ j, a) t3 B6 p/ e- b3 I0 j. \
* h) x! i9 J( \2 |' N) l* G$ t2 P1 z
严格证明过程请看刘建平博客:链接$ N+ y! R1 |* Q5 [/ X
可以看到,对于某一个子图i ii,R a t i o n C u t RationCutRationCut就对应于h i T L h i h_{i}^{T}Lh_{i}h ) ]! L. `5 P6 {' T
i9 h$ g! G8 N8 }7 V9 R9 A( g- m5 `
T 8 E( ^" u1 Y* B6 r+ f# f/ d! S$ m& s% Q, {! h6 w, r. s* G: M
Lh ; @% d- g) J e- l! p8 _8 Y4 S
i( B9 L* h% `) k* Z$ W7 Z4 V
# d; Z, t" y% w! C0 T" T
,那么对于k kk个子图' b4 R& R' V. { ~6 s
# C" I' u M$ s6 z' R( c0 g MN C u t ( A 1 , A 2 , . . . , A k ) = ∑ i = 1 k h i T L h i = ∑ i = 1 k ( H T L H ) i i = t r ( H T L H ) NCut(A_{1},A_{2},...,A_{k})=\sum\limits_{i=1}^{k}h_{i}^{T}Lh_{i}=\sum\limits_{i=1}^{k}(H^{T}LH)_{ii}=tr(H^{T}LH) 5 {/ Q" i1 ?: m; o4 @8 KNCut(A 4 M4 R6 M' r* Y c- [1 p6 i2 l8 ?0 k* Z
1& J& M. f% J- w/ Z; ]
, R+ [- U& u) y( w9 j7 ] ,A % i/ F! }$ s/ Q% s$ B, p5 m3 T2 ) _' y$ N6 r) m# b3 h- c1 K 0 ?3 f8 z) Q7 y3 `2 D' Y0 k9 y0 ? ,...,A 5 a2 }" B" I1 x S1 G; k
k6 `2 }; J0 G, D- ?9 n8 _2 p( U- J
5 n7 M; i4 M, S+ G' `+ i+ A )= + \- p/ j! @: M
i=15 a, B, L& q+ V4 {& [2 e' C$ c
∑. a: d v) q9 n/ R% Y+ k
k. p& p0 p5 |9 Y# M) W1 ]2 I/ [0 Q$ D
5 t% h" Q0 [9 b; d h ) T* j1 p! d. |& `. X. f/ \0 A
i8 ?9 F& ?/ s Z; R
T f& \. Y, H0 e- z 7 q$ n0 r6 o: B( Q) `* k) d Lh 4 R$ ^' w0 O* W8 D/ l( |
i( j, L1 b% o# _6 l
9 Y- Y( O" G# K: c D+ x$ O = 3 d( X Q B& s6 w6 Q3 u( I$ {
i=1, {4 P; E: ]* R6 J# c6 ~
∑ ( U$ }6 h- U9 z7 J! v, R7 N$ Ok 6 V {( {& r0 C! N8 K+ D( F( C" [ Y( U3 f% @
(H 6 B/ Q1 |: a/ g6 ^. t3 Y4 v
T. }! M- ~6 d4 F" ^, k; @; a1 j4 T
LH) 1 |: W" C6 w& Q$ c2 j n R
ii ( m! Q1 b" Z! |0 K( y 7 p- ]2 Q9 N, G( o) i, { =tr(H : m ~/ H" }6 y% m ?* }+ pT 9 e: ~1 T9 k; n8 X* r LH) " v, ^% {( O3 }, k( c( ~ \ $ b8 l8 o ~- h' k2 d( S- u但此时H T H ≠ I H^{T}H \not=IH & I" C# i( r0 r- W( j0 g3 oT, ?* H6 M; P7 ~0 d L
H ! H6 W; g% v, J* n" O: K% C7 ]$ j, Q; z$ p' ~6 f0 d3 _( ?9 j
=I,而是H T D H = I H^{T}DH =IH ) K, N8 T8 m) P( V, F4 x6 o( s% b
T+ a- ]4 L, m7 e8 T5 X
DH=I5 N9 S2 u# l; S
) z! p1 g9 {% {: \
这是因为h i T D h i = ∑ j = 1 n h i j 2 d j = 1 v o l ( A i ) ∑ j ∈ A i d j = 1 v o l ( A i ) v o l ( A i ) = 1 h_{i}^{T}Dh_{i}=\sum\limits_{j=1}^{n}h_{ij}^{2}d_{j}=\frac{1}{vol(A_{i})}\sum\limits_{j\in A_{i}}d_{j}=\frac{1}{vol(A_{i})}vol(A_{i})=1h 0 o) ~9 W* J! s" N5 N# [8 }; B
i ( q; l( d5 j" s+ U1 V# p/ kT 9 F b! j1 I: G6 e4 S9 p! w* q- m* @. U% U* R1 Q) K
Dh ) J( o# x5 t% b+ r+ Q
i" V! P6 _. T" c& G4 z3 H
) {# X1 _: Q3 o* a! w = + x/ `8 L# |* s0 l6 [. Rj=1 ! m8 p1 h7 B; G+ W% j. D1 ~$ H∑: m: C* F# P6 F6 q
n, }5 X% s$ X) n6 B3 w- }. @& m2 k
9 e H* N/ O% I" @+ Q h # P# `2 c5 k, P9 h- {2 l. d" Q% o
ij 0 ?: ]5 e% |/ {+ T! n- V' S2$ \! Q. b. p. e* C/ j" G3 R
2 }* W Z' v3 l, l1 {2 @) L7 ]
d 2 ^3 l6 P/ y/ U; f4 mj' O( r- t. q! E7 Z0 p
2 R& v: V, d& I9 x! H = ; ?: P4 p* l; `vol(A , u) u* J0 H$ s' b2 t& _) }5 x7 x
i1 z, r0 ?8 H; `# c
) t* c. l4 s/ w2 e5 G2 q ) 8 Y! e6 V( ]& C1 Y/ F* v/ _* F17 L1 F# u' W+ E q3 W; j
5 u- u0 u4 R$ j* F) |. q f: F9 E; ?/ ^
/ L& }" m& L8 j; m% o
j∈A % G8 S7 G$ b$ I7 Z" w/ zi - k( z( Q* c2 v: C& J% Q+ V 1 \: z2 }: A, y# S$ Y ]3 s: B4 K# c( q- A" Q
∑7 d1 e, c* J: p" M/ L
4 v5 V" f( u/ ^$ l* ^ d $ Z2 y/ N% o% e; S, |% K4 Hj 2 _7 x1 q }& |3 O# W $ V6 l6 a, x" s% p1 ? = 6 K {, W9 F# j( P3 n1 M: j
vol(A & l; E8 |0 t3 o* Di: w4 a) U9 T8 i3 A* `2 E8 X
" H/ g' c9 H" Q )6 c. w( Y/ I9 b$ G" Q. V1 k
1 * g0 Q2 y K0 x% x. M/ o9 G( e6 ?* {; j8 c5 g& b9 ]
vol(A : s9 A1 N: \3 [& l: [$ z
i 7 I" K n0 w& J: z1 \! o' O$ d( e
)=1# k; f' l, W5 [( X/ P; }! q
因此,此时切图优化目标为9 o# w* P+ h s: i) X: p, ^+ M; O5 {
: l7 g' I, D1 t& O- Pa r g m i n ⏟ H t r ( H T L H ) s . t . H T D H = I \underbrace{argmin}_{H} tr(H^{T}LH) s.t.H^{T}DH=I . ]1 y" j- {! T6 g# C' aH $ o* O7 X( Y/ Q( }) Pargmin ( n1 J, t2 B; ?( D, z, H! p2 ^* J4 H
, |6 ?4 e( |# ?& f- L: x! n5 `
8 \; D S, ?4 A |2 P tr(H ' V* L' a" s% b, V
T' c5 B# m/ L% N* M. A$ H
LH)s.t.H 8 d( U' q, q) F. x1 _. N
T ; L( X9 g ?( h' e DH=I6 K; O) ~5 O/ w) n5 A$ c7 X0 A, t/ _
, \8 K0 R+ B& Q8 O# C: e }
但是现在矩阵H HH中的指示向量h hh并不是标准正交基,所以需要对H HH做一定转换。令H = D − 1 2 F H=D^{-\frac{1}{2}}FH=D % X" Y9 z3 Y1 N) x− ( i2 z* @3 ]; z; g7 z0 G
2$ E8 T$ D7 G/ }0 _1 j% S2 j8 ?
1 ; O( U7 f4 M( ?! _: g0 s ; z3 L' M( p! d 9 P( l% f% [7 ?5 y F,则H T L H = F T D − 1 2 L D − 1 2 F H^{T}LH=F^{T}D^{-\frac{1}{2}}LD^{-\frac{1}{2}}FH ! | c' q0 ~+ S9 K% A5 i4 rT . Q5 {& P* B8 h3 ` LH=F ( f, F% X8 X2 e' N
T9 F. F( n( ]/ N2 H) m5 ]/ S5 {. F
D 1 k8 t Z: K; h0 x- e* X- q' M6 A6 u
− $ {6 u, V/ W1 W: _0 S2 . c$ k& }- u: l' E* D% ^* ^: Q19 z6 a3 t2 z+ L7 e' A# }& f
1 Z5 K& Y4 q4 O" N3 ~& q
! P; I* n/ F3 W8 O( L LD k' D6 `2 ]2 _- ~
− . ~/ h: R: u6 H& m& R3 U7 t2; z+ b, b6 \( H. z
1' q1 U% W$ }2 A
2 D7 }; X8 B8 j3 ~$ Z% Y
# `8 m5 r3 K# E4 u( S* { F、H T D H = F T F = I H^{T}DH=F^{T}F=IH 2 F" u/ i! n* k# G
T4 n1 D4 t3 D6 f7 l" d* _! q T0 C8 M
DH=F 6 O5 \( c; _2 n" b P6 y
T) \ e5 M* p: g( S, C6 f) [1 x
F=I,于是优化目标变更为 ' j7 h% p0 `7 La r g m i n ⏟ F t r ( F T D − 1 2 L D − 1 2 F ) s . t . F T F = I \underbrace{argmin}_{F} tr(F^{T}D^{-\frac{1}{2}}LD^{-\frac{1}{2}}F) s.t.F^{T}F=I7 m/ c4 ^+ U- U, Q4 [
F / `- {* b% Z6 X& r% E6 I0 Vargmin. d0 T j9 R5 h* P' L" B
1 j. r' F" K) }' ^7 J9 s" Z" S8 H( o- n; g' M
' Z# S- _$ [4 r2 k1 y+ d% W
tr(F 2 h# E/ \6 O& b3 B2 e2 T+ S# H7 ~T ) f8 |' v9 d+ u9 T D ! x" p% C+ J% q* G0 C* O
− / ?, @% @: G1 u$ y9 x2 \2) ]; L, w; {: l) L3 C
1 ' X; c6 i( {* S% i' }. d% |3 w9 L: P( |. Y5 T" O
7 v3 x1 q; E: d' Q LD 1 I" t# x/ v' @7 `# Z% T+ Y
− 3 m0 Q/ R' C& _" i' G5 F
2, u' I( d4 X: j- C8 D
1; b1 R- U4 w9 c
! V m: Z) X2 X% Z3 _
/ I) J7 t; ]1 b3 y- x; p) x
F)s.t.F " `4 e1 }2 j3 n4 K5 X) e8 X% K8 H
T : C- I- w8 A, m, r F=I% p8 F5 D+ @( F* h
~" \' J, x- G! h
现在,和比例割一样,通过找到D − 1 2 L D − 1 2 D^{-\frac{1}{2}}LD^{-\frac{1}{2}}D 1 Q9 N9 Q4 b" J" k$ B
− 7 F3 S" W% Y9 w- t5 B8 k( T2, V! d$ w# t T/ H7 K9 ~" D
1 & k2 u4 d4 B6 {. I0 R ' j# W4 s) o0 g- r0 E5 @. y4 i Q! ?: X* b
LD 9 u2 I5 ?6 \! b* b/ |1 V5 c1 {- }6 h− & X( z% M2 O8 p; o* x: ]
2 - G, X, r M& S7 M! o1: _- d2 K, {5 s+ G# X
7 f- k" [/ H; Z7 N; K! o4 J- x: T
# q0 D [4 a4 m1 M# z (就是之前的L LL)的最小的k kk个特征值,可以得到对应的k kk个特征向量,这k kk特征向量组成一个n nn×k kk维矩阵,也即F FF,最后对F FF进行传统聚类+ t9 F% a* x$ d' @
% d8 k' @$ S9 Y l0 w
一般来说,D − 1 2 L D − 1 2 D^{-\frac{1}{2}}LD^{-\frac{1}{2}}D 0 B" g3 y( D3 P. V0 L; R− 3 x5 g/ l- R/ c' t
2 " E" y, C; n; M) A3 `- U! P0 N' B1. |, j" C3 `# \* m
) \* G& b: ^; n" H
. [7 s0 s8 P' x0 H
LD " y, C6 ]% X+ v/ r$ f) Q& f
− 3 Q+ u0 Z. N- k$ F& X2 + @' H# ` K: {; m8 x/ b, ?1 f8 l& o4 e% u. Z
/ ]6 u: K( H; F. t5 t
, k0 v# O, N& ~# F. o4 k3 v 相当于对L LL做了一次标准化,也即L i j d i ∗ d j \frac{L_{ij}}{\sqrt{d_{i}*d_{j}}} 2 d8 T2 a2 g9 _9 n' b" l3 H q" Xd , ` }( j# G" _+ |' y9 z/ b% ]9 ai # [* N5 d' S9 R& h; _6 d% P4 c, }9 y H* Q
∗d 0 x0 `0 N# a; G5 C' ?- fj 2 r7 l! s$ D- ?% j% S2 q- [; ~6 { 1 h. I" @; ]/ l 0 X5 E6 S; M9 o2 J# u 5 T4 }0 p& h" k( S- ^8 F: ?3 ]5 E7 B/ s" O
L . x0 n' d- U: c# C; u/ yij( S& t0 o4 Q+ u* I. m! F1 \
y% K- x; c$ T( _ : e) E3 X s1 \& c9 m G1 y( c8 r3 W" S. p0 _& B: s7 v% V
二:谱聚类算法流程 9 [' ?6 ?! J1 R, y2 a给定数据集D = { x 1 , x 2 , . . . , x n } D=\{x_{1}, x_{2}, ... , x_{n}\}D={x ( W: E4 y: e7 q# t |5 D1 U12 Y; R2 `- e$ t- t+ k
4 s6 i1 _! I! ]
,x * |" _! b+ `: M3 U9 D0 ]
24 L* Y% p" ^! K) t/ t. E4 J8 p
2 S9 B+ t( U9 I" l B+ w9 N ,...,x ! y: Y0 a8 q- n' Z" C2 G7 qn 1 j6 k7 U3 J8 n. S$ E" F. f % W: `5 q A4 g4 e; @ }. i: G* e9 Q( w! l8 r
6 i2 L7 V3 h' j% L
根据输入的相似矩阵生成方式(一般为高斯核函数)构建相似矩阵S SS(AffinityMatrix)# l6 z S! r7 a7 @
根据相似矩阵S SS构建邻接矩阵W WW,再构建度矩阵D DD 5 D( j$ c- d& U6 L' O/ [1 G计算拉普拉斯矩阵L = D − W L=D-WL=D−W % l: d! f5 O8 ~, {: o; l得到标准化后的拉普拉斯矩阵D − 1 2 L D − 1 2 D^{-\frac{1}{2}}LD^{-\frac{1}{2}}D % ^ t* {9 z, U, w+ N; i
− 4 O* e! G2 ^1 O3 {& E, Q
2" V" V# X3 C7 f% Y
15 t' n: E# y7 u& `7 }+ c. I/ y
" r+ ~" P( _; n3 n; p* Q : z$ u: J' z' ~3 E9 i LD 4 F" E) E2 i6 ?2 M3 ~: \' k
− h, t: L: s9 ~; D" O: v& [2 Q
2 # A: k/ \, q4 t2 a# X1 7 N9 k# F! M% K- b7 S8 A6 {' h0 ?" T