% j9 d6 g* [0 ~. Eh i j = { 0 , v i ∉ A j ∣ A j ∣ , v i ∈ A j h_{ij}= $ P% ?$ Z/ Z9 J Y+ @( m{0,vi∉Aj|Aj|−−−√,vi∈Aj , B) U: ^$ u% ?% u& O: E2 Q{0,vi∉Aj|Aj|,vi∈Aj 6 B' j! u8 `/ N3 _h 5 A ?9 z7 S- a* c+ z2 M- Y. ~
ij$ q1 H. l6 K, H f* y
; e0 U3 ^* L( J: X ={ 6 @& K5 f: q" q8 l0,v # C o/ M$ n L6 H3 R+ Ki* v- S t- j) v7 d
3 L8 a: C" C) b ∈ 9 E& j7 X6 m$ ^4 @1 e/" N2 E) P8 n( {
A ; C9 n% T, J! \( y9 Uj; R& L& T5 Y$ I" H! X
6 w; ]( C P0 W5 O- \ : P1 l: U% m( Z1 |6 y) y∣A ' n* ]) W; W! J/ R( h7 w
j , t3 ^' |/ s' {& t% g5 h) D p3 d# ?9 w& @
∣. p2 o* G8 L4 N p" o3 T$ L' j
. z& V8 y" s E- b0 t. V5 N! C" Y( g ,v + c0 ^* Q) m: p" I
i 0 A% `% g+ `3 t- T: Y, a6 n) v % a* _$ n/ K' J" l7 g% _- E. ]* p) p ∈A ; d4 T6 T0 w: o/ z( t6 ~
j$ g: ^5 c2 f, R) y
) @9 {' ^! J, e; d2 x : }2 T. b( ~1 C# z7 K/ F# ^ 4 Y' I- O9 q1 a5 Z6 \& q, @7 E : I! `$ Z& @! W& M+ X' S$ A/ n' O# t7 e: `7 S" _) S/ T9 F% c
于是,对于h i T L h i h_{i}^{T}Lh_{i}h ' e( J+ K- L& F" Q u% {8 b. W
i / k* \2 i8 z5 GT % s1 a3 U' c3 Z4 V, U7 R 7 m4 w U' O2 O* Y; v# L Lh 7 U H7 A& w6 y* Q4 R1 Z2 x
i ; H, g) {, s* ^+ ]% S% F& O# [ 2 V z& g( M8 i! v9 W3 N+ | ,根据拉普拉斯矩阵性质可知 Y" y! @' Q& t5 D9 ^- X. r" q8 w' O
对于任意向量f = ( f 1 , . . . , f n ) T ∈ R n f=(f_{1},...,f_{n})^{T} \in R^{n}f=(f ' W' k. z* W# |2 A
1 # R) A5 p# o' J, c2 _" U* k- v6 ^% D' K. Z$ f
,...,f @. h% z) |+ `6 H/ z, A
n % w+ B; \0 d, w) K, v- _4 v. w+ z. H $ Q" M, J5 ?# I# @6 G4 M H) ` ) , X% C2 f4 k% I; `3 A) L$ TT + ]+ `" s( }- ^* c ∈R ( _5 o, Z' j6 `) w- Q# i7 bn : ]5 P: B7 w: F! {2 x5 ~ ,有f T L f = 1 2 ∑ i , j = 1 n w i j ( f i − f j ) 2 f^{T}Lf=\frac{1}{2}\sum\limits_{i,j=1}^{n}w_{ij}(f_{i}-f_{j})^{2}f 7 s* C( A2 V1 o. \4 a
T4 `$ j# S) f" f7 a! E
Lf= , ~3 N- b" R; F# y
2 : u4 H4 F+ ] o' X1+ m `' W8 o/ y Y
4 g5 J; X. Q5 ~. C4 K/ x$ e ; _8 n5 Q+ Y i$ o! Ji,j=1/ O- H+ V% q: ~* \/ E
∑+ F) J5 h/ X- ?9 E. h2 o7 J, A
n2 F/ B1 b/ k$ S, P3 K& P
3 I" N3 Y. Q* k* } }
w + x& Q" K: H: e5 fij+ S& e B# N' C3 E1 x
8 g. `6 _: w z6 C4 C' D9 ]
(f ! _" m4 J5 m3 ~: k2 b' X
i & I* x, Q- W* r 6 u: Z9 f5 L3 c& u4 g/ t −f # D" r6 h2 @: I+ L9 @3 [j + ` n [8 S3 u9 f / ]1 l7 B6 I1 ]! A; q ) ' R; g( y) M L7 z" Y5 u1 c% C
2 3 G( f# t; O/ o8 t: O' j, p t; W$ J
h i T L h i = 1 2 ∑ m = 1 ∑ n = 1 w m n ( h i m − h i n ) 2 = c u t ( A i , A ˉ i ) ∣ A i ∣ h_{i}^{T}Lh_{i}=\frac{1}{2}\sum\limits_{m=1}\sum\limits_{n=1}w_{mn}(h_{im}-h_{in})^{2}=\frac{cut(A_{i},\bar A_{i})}{|A_{i}|}8 t; H/ N1 x1 [3 p& Q E6 S6 [
h 7 v B; X% U3 B$ B3 U" S: _% Y* ~4 w. O0 `i 5 t" O* g6 I. u6 v+ jT, Z" |* x0 {4 C' ]2 e
5 G G5 U# d' D
Lh 4 `& u$ G. J6 b+ t
i ; M& ^7 X( O( W& G+ v' Y( G' q5 D7 L3 g
= 2 E9 S; m5 U, o2 , `# ]9 Q1 A/ f( u2 ]. b: j1 8 s8 I3 H+ a) j; c ' D0 ]" A' Z e3 D A8 q1 I, [
m=1 $ n) ^7 d# ?1 l+ b; r/ o∑- F* o% k# Y8 D
1 T' v; o6 A. A$ [0 u k+ x$ ] , L t3 o( r& d0 Cn=14 F, N2 W, q8 L% a# S% V; b) }
∑ 2 y- b7 _+ B8 r3 }! k! C9 ?/ h; p6 q, v# J& i; q# A
w ) D: m/ O9 p8 O' [6 y. Q( m6 |" T
mn$ L, D: }" B9 w: j
7 d2 K& k; V* F! d* F
(h 4 k& l) |; N* w/ h' y2 ^' Lim9 t! l5 I9 y2 @# l
9 e2 Z0 s2 F2 Y( |# v
−h : }* U1 W3 g s+ e- A- g
in- N1 k% E, n% }! {' w1 _; _
4 j3 a* h/ L0 v o$ p$ d4 P ) 5 S. Y5 q) O. x6 O/ b
2 , R P4 x- U. l' J/ H. V z = % l' u- _$ t/ x$ O∣A $ O) |: D+ d* b* n+ |
i7 f" L. G' B; H, C) \+ r
# F$ n* i2 H* s& [
∣9 y+ E5 R, V+ C3 c7 l
cut(A # `, r. x) q* d, Yi E# w- c0 A& n5 X0 H. i
+ T3 g! j% X8 T. s" k. @8 v
, . Q$ d+ q7 C- e1 |. a- r
A 6 i* n* R2 Q! P" a0 ?ˉ + }9 F, o' Y- r6 \4 D* L9 Z* D9 d5 z- e: ~0 D: u; ~1 F' ?
i6 |$ Q8 |8 c0 f& l# O% f% T
' `4 }" Y _& p
)6 z# x, W, e% w1 K7 u
/ ~- O3 o6 J) l3 a6 o. R1 Y- U. v+ \( Z- z1 K" H% _+ F( g
: I+ |3 P) _+ J) M2 a严格证明过程请看刘建平博客:链接 n' f' I+ `8 e. D. _- u
可以看到,对于某一个子图i ii,R a t i o n C u t RationCutRationCut就对应于h i T L h i h_{i}^{T}Lh_{i}h ( @& S h' M8 V" F
i . @- @* V3 z' K9 s2 sT5 ^' v$ Y6 a/ p+ y2 D
$ J e$ }# @/ v5 N; q Lh ( Y, ?& X. m# ]- Ei + P. Q1 k5 o# s( t5 a! C3 |* Q/ x. M1 z( P" d
,那么对于k kk个子图 8 L+ }: E( e7 o% @- E9 b6 j% Q/ \1 L; r2 B
R a t i o C u t ( A 1 , A 2 , . . . , A k ) = ∑ i = 1 k h i T L h i = ∑ i = 1 k ( H T L H ) i i = t r ( H T L H ) RatioCut(A_{1},A_{2},...,A_{k})=\sum\limits_{i=1}^{k}h_{i}^{T}Lh_{i}=\sum\limits_{i=1}^{k}(H^{T}LH)_{ii}=tr(H^{T}LH)! O- T; N( k5 u7 R
RatioCut(A b1 e/ ^' x/ P$ t( c3 B1 f3 F1 : x( P: T [; [5 v3 A' E" I 5 q0 o7 w4 g0 I+ p( B6 A ,A h/ s% V$ i' _2 C
2 + m8 i# `, O) u3 B& d9 g1 b - W6 X a& w5 s ,...,A / i6 V& k" a& [8 l/ Mk8 l' c# u: a2 \, S
! O$ G. {- o1 V/ l! g, N2 n3 V
)= ' E" z8 n# p; ]) {
i=1( g7 B. w2 u3 t! z/ h0 a
∑ - |% ]$ U3 P7 ` M" E% _8 Uk 7 c% m) ]: s) q: d% t * R# }, U$ l6 z h # Q- P% j9 r2 |# G2 G3 A6 j4 fi) j: d0 e: B: i* ?
T : o d1 v/ R( R8 g7 y. `5 @, H+ e' f" M5 s2 y# M) e0 g
Lh " }' S2 H. u7 M. r2 e# b1 u
i : o! d0 ~% s0 U( W 4 x$ Q! E8 d4 |. v6 S! F3 C( g = 7 C$ J2 d# q& T7 J3 n
i=17 m( i0 N4 V* @
∑5 [% a# L2 T0 A$ D
k7 ?+ x$ b2 W# [% y8 [1 ?$ c2 p
# _) \' M: t9 Q7 U7 s w" v (H 9 H* ~6 |/ i9 C. e9 V
T ! j9 l2 I4 E6 Q( s! A2 j LH) 3 g2 h' @# g6 G0 j9 x
ii / R3 ]& C/ r, r) c5 M . t$ _) P* X9 K, { =tr(H ; T& h8 T) z4 O1 E! V" V
T4 x, }3 L5 v* L! ^: x8 G
LH) * p+ s/ B6 N4 J9 Q" K# t4 M) C7 o% T3 s3 Z$ K
因此,R a t i o n C u t RationCutRationCut切图本质就是最小化t r ( H T L H ) tr(H^{T}LH)tr(H 1 j' R h5 j1 d& M4 I5 sT4 r3 N5 ~2 p) {+ E! O
LH)。又因为H T H = I H^{T}H=IH b3 ~! ]+ C% y K" W1 c4 yT- K/ H* W, M0 l) t; f
H=I(单位矩阵),则切图优化目标为 ^. Z9 @: S$ i2 i4 Q, {( `& j3 }4 J/ g/ D* S5 w: `( V
a r g m i n ⏟ H t r ( H T L H ) s . t . H T H = I \underbrace{argmin}_{H} tr(H^{T}LH) s.t.H^{T}H=I8 A& B d! K$ t9 h" V
H# g9 S6 s& ^3 O5 D$ G
argmin7 y% r `& b2 W
9 n, w* P4 x0 C- X* A
~+ g* {$ H: c7 J5 N4 T* k6 X: Q# D0 t7 k8 x A
tr(H ) H, ?7 g/ O1 P, F6 f5 V0 g' i& Q
T2 S5 _3 a% ] L+ d" z$ W! k% [
LH)s.t.H # `8 F, y. y+ w- z9 H; E% \T8 q2 ]5 N; v% g0 E+ {" `5 i
H=I 8 k, A+ K* ]! G% b% [1 i; r, m3 V+ f6 B X n
对于优化目标t r ( H t L H ) tr(H^{t}LH)tr(H 8 m7 {) R1 x+ _& H }t% U( L7 Y! _' r( {+ b% A# P, D, q7 h
LH)中的每一个优化子目标h i T L h i h_{i}^{T}Lh_{i}h $ c# W9 D9 O% r' ^7 _( q' \( Ei/ M% O) w \7 O
T% G* z/ e% e( _/ a/ E1 m3 d
0 |8 d7 C) H7 T! p3 U H2 M
Lh $ ]7 U/ p6 F7 v3 s' ]- C. Q
i# A$ }$ n/ q4 L; |
4 C/ v2 Z1 G( Y& b0 S; _5 w ,其中的h hh是单位正交基,L LL为对称矩阵,所以此时h i T L h i h_{i}^{T}Lh_{i}h ) S; z6 {5 w- z: n" K
i ! }, B7 h$ z1 u3 R3 wT6 H% K8 q) F& p9 A: V. @
+ l; x! K0 u. b( J0 c. G# ^" W
Lh 7 b8 q8 C, T6 A4 g5 I qi) m' b; Q% S7 j
7 K+ L3 O3 e' r j. V 的最大值即为L LL的最大特征值、最小值即为L LL的最小特征值。而在谱聚类中,我们的目标就是要找到目标的最小特征值,得到对应特征值向量,此时切图效果最佳。所以对于h i T L h i h_{i}^{T}Lh_{i}h 9 H5 x) H* \, X4 w' v3 Ti * a# \) Y2 D/ v t, \T 7 J M* d6 x% q' g6 { |. M& Y + G, U0 V2 M3 ` Lh 0 _, B4 Z$ l, O; w; G5 C' E! Y' I" Z+ U! N
i + u8 ^9 g; n7 U1 |: o: ]& G+ M+ t. {' k% `3 {- F @
,目标就是找到L LL的最小特征值,而对于t r ( H t L H ) = ∑ i = 1 k h i T L h i tr(H^{t}LH)=\sum\limits_{i=1}^{k}h_{i}^{T}Lh_{i}tr(H + S' _6 H. l; o
t' p! s1 S1 t5 m1 ]$ R; ^9 ]
LH)= 3 i& b4 e/ y: l1 S/ M2 T; R( k
i=1 0 t0 d \) |! x$ w∑ 9 Q) z6 N% q$ Q5 \' ?. e+ tk' |% l5 ?4 H5 q- h+ J2 Z6 q5 P
3 c `7 j6 e6 A+ j. z# H7 X h # k* B$ D& x1 c# ^! d
i; R- k( n( S; f- B
T% u9 b! y; {9 o& z u+ v
) J4 y2 o; S. a( b% I Lh + W# F) a: F+ B* e# G; K6 n1 G
i ; d+ G! N4 k$ ]3 z7 ^1 z Y: N m* u8 \* N, D
,则目标就是要找到k kk个最小的特征值 % J* y4 ? s: V; @ : U1 s6 u+ ^/ J5 y因此,通过找到L LL的最小的k kk个特征值,可以得到对应的k kk个特征向量,这k kk特特征向量组成一个n nn×k kk维矩阵,也即H HH。一般需要对矩阵H HH按行做标准化,如下 1 q, V, B. W2 F8 [0 i7 F: I, a* j9 S" ^& \7 T8 b
一般来说,k kk远小于n nn,也就说进行了降维8 W: Y- m- N0 R5 Z ]9 D% i" V
h i j ∗ = h i j ( ∑ t = 1 k h i t 2 ) 1 2 h_{ij}^{*}=\frac{h_{ij}}{(\sum\limits_{t=1}^{k}h_{it}^2)^{\frac{1}{2}}} ; W3 n9 e% M4 d- m: c; F! M/ x# A) uh ; L- Y1 `8 _. Eij. d5 i& S1 h9 P8 q. j
∗ ( }) K& ]; D- P6 M8 o( h& Z! c3 y * f; [+ J$ y& s1 A" P% _: n$ z& U = % c( y a& h& H
( # f- V0 N+ [" Q6 ~: Y
t=1 1 B& ], I- T- s8 t% \0 _$ e∑! S X1 X8 Q2 G' N3 ^
k# l5 {, ~3 C" h6 p* X* e
: h- U7 E) d! p9 E2 K3 d$ J/ W+ ~ d1 } h 7 d8 I6 j+ N( C1 L) L! W4 ]8 Sit1 y3 P( I/ P' D3 c
2 # }) K5 O# b j3 H0 Y 3 D, [3 c% @* |" w# o ) & {6 E! J) P1 P0 V4 E. F1 B9 j
2 8 \ W, p0 |: j& J- y a1 8 y/ s3 d* \6 H6 o $ S8 m8 K9 P" V V, Z; k( I ) F y8 l( i+ F2 @, y4 {; k 7 m, A) [9 E# s; f) ph 1 q( v& ^6 Y1 b( T% ]# U* G/ d
ij1 b! t' L4 a5 p6 I& O+ R- S
" M0 D! I+ [% q% e' V% W! T
! y4 \1 T9 I4 J# r ' v9 }0 |: i% M0 z: p9 t9 n/ _ r( b: }, N# H
# p G* H" Q+ }& C8 ?
这里需要注意,降维后导致得到的指示向量h hh对应的H HH现在并不能完全指示各样本的归属,因此一般在得到n × k n×kn×k维的矩阵H HH后还需要对每一行进行一次传统的聚类,比如使用K-Means聚类 U w8 b( }! I' a , f+ v0 ~6 U) e3 m4 Q(2)规范割(常用)5 g8 ]0 x4 |& k* s- h i3 H
规范割和比例割类似,只是把比例割的分母∣ A i ∣ |A_{i}|∣A % u, M+ R" n. n2 _! z9 Wi1 r* k& s; \3 a2 ]
: w8 q5 t* N4 {% A9 m( ?( `1 `8 V
∣换成了v o l ( A i ) vol(A_{i})vol(A l- w G! T- S* n( A
i / d; q, R0 ~+ r$ [4 U/ y 8 }! I4 P! N6 N ),定义指示向量h i j h_{ij}h * |& |$ |: X& ]8 F5 d& x* \1 n) c, ~ij " l! e2 K! R9 q# p 5 k0 p, K, X: N4 f) k% r- W7 G 如下; D4 z. S1 _6 n7 |
: r1 P3 c9 W: J, l
h i j = { 0 , v i ∉ A j v o l ( A i ) , v i ∈ A j h_{ij}=) \& J8 E9 ^6 Z3 M$ Q6 c
{0,vi∉Ajvol(Ai)−−−−−−√,vi∈Aj8 D! C* d4 p3 g+ o1 [
{0,vi∉Ajvol(Ai),vi∈Aj $ M, m: d, F3 L0 b' E/ fh 6 ~, y( C- p( p6 |; |! {
ij 1 x" w7 \. c# e0 z# A/ k 7 d( T2 W" m# Z" x% Z1 O ={ : Z; F! X# Z% Z. ]/ K0,v 2 F( ?( ^# s3 Y8 U( N6 o
i$ S; y/ Y+ R" i* t: o* n7 T5 s
' F$ d: Y8 x7 t s/ Z% F3 `6 g
∈1 o; m5 A D: J3 H+ A- L
/8 [( |+ E5 I9 {2 Y
A ! J1 S7 C" Q; v2 T; k" _j , F" ?4 U( I. C1 j8 e$ {4 B# O! E" [' w
$ L- F& G) [& V& y* y) Rvol(A 4 G* u) s$ d- C! p6 {9 `( T5 y
i 1 j9 H% ~* X5 u' f+ @0 w: j5 ^) J. r
)) } a7 e! q6 f
/ I# g- F% @: x) q |1 c
,v % {2 R* w% @$ |+ i4 v# Ji+ E$ n. S9 g2 U6 O+ J4 y# K
3 H' v( s" e4 l+ g0 |; {
∈A ! K$ J7 N# P2 B1 o6 b0 aj , V+ n4 D9 u; v! P0 M' r! A$ }2 O4 n : ]4 S7 q3 x w* V4 p7 b; q0 A% g4 B: U0 O. E/ ]: r8 Y! n
+ ]4 I% w) X$ l 0 y3 |3 L! v" q/ n4 _% H2 ?9 \ 4 s7 a* }9 p& N于是,对于h i T L h i h_{i}^{T}Lh_{i}h 0 C" c" \- L" S) B; li8 ]' \$ s4 K% d
T- \8 E- z* o3 O' \( l, ^
. M7 a: j4 W0 Q' m! z( J k5 h Lh & i/ S( ~) B! `, ~. \! U! ^: ei' E) H2 s. \/ y7 Z+ E2 Z
( y, q4 {1 i0 o- n3 z8 r7 ]4 j, R
,根据拉普拉斯矩阵性质可知 ( w; ?; f$ G; t/ d6 c# u9 a8 W7 n7 m% x" s9 B- C) n8 j
对于任意向量f = ( f 1 , . . . , f n ) T ∈ R n f=(f_{1},...,f_{n})^{T} \in R^{n}f=(f : i; j( G% J( O7 b1" `+ }! U8 E. x5 I. ]
8 }/ T9 O% q, ?8 ^% O: P: l
,...,f . |2 l# V6 Y( bn % `- b6 b5 w! |+ R2 |' T# v4 X$ t5 ]1 V
) 9 \7 N7 X* G- y0 r# Y
T ; s) @- f* k- C; W& a" } ∈R : V. U0 P4 |) a$ j7 r, _0 cn 9 C: ^7 u+ Y" x# q' Y8 x( t ,有f T L f = 1 2 ∑ i , j = 1 n w i j ( f i − f j ) 2 f^{T}Lf=\frac{1}{2}\sum\limits_{i,j=1}^{n}w_{ij}(f_{i}-f_{j})^{2}f # `3 k) @& a$ ]& G3 r) V
T0 }/ t1 l) ?$ H% T6 v! N
Lf= 1 f8 X& q- o. B
2 C7 k5 g* Y6 N. n
1 8 I0 _: V: e2 R3 P, L- X3 G& H: f1 H) E" f8 s
/ d" N% z) q8 k# L1 Gi,j=1 $ @" x3 y4 I5 ~+ @; K, O! ] B∑ 5 |+ d8 o( R0 yn # [7 C( X7 L7 W a1 J 3 N: Q1 A) l" E, e( r w 6 B, {& K4 ^4 M; b# Qij 7 {2 I: M, y( ?+ x( E1 { 0 k4 [$ ]$ F) H- }6 S! ?1 r (f + J& @3 B8 l7 S ?0 d& Y/ di; J9 g( Z$ u( i% @( F5 `! t/ c
" C3 M4 Q c2 t) S! u- s
−f . z9 c4 P& V( [
j # f7 a j& x; T- l+ o# a; ^4 l5 B8 |' r
) 4 x. @0 N9 |. Y' R5 y
2 2 F0 B! c1 w) j0 X/ N " h4 `; Q/ r+ ? gh i T L h i = 1 2 ∑ m = 1 ∑ n = 1 w m n ( h i m − h i n ) 2 = c u t ( A i , A ˉ i ) v o l ( A i ) h_{i}^{T}Lh_{i}=\frac{1}{2}\sum\limits_{m=1}\sum\limits_{n=1}w_{mn}(h_{im}-h_{in})^{2}=\frac{cut(A_{i},\bar A_{i})}{vol(A_{i})}. x0 C$ |! P' O' o- p9 v8 ?
h 6 k6 k/ A# B4 _0 ^+ D" Zi3 a2 f# g5 s: x
T4 @. t1 h6 H7 s# L" }
: s% H* q! P# v. O. U Lh : ?" k3 h; P" }- yi . p7 u, K5 p* l F( S1 Q" F' h" b
= 3 z6 W) ~9 \4 [
2 " I8 _: h6 f6 d5 b" m- [1 , \; @$ L- q( `, D/ ?) o! m. r6 C/ E, C! B6 I% Y