6 Q: L# h& e' Y! X一般来说,k kk远小于n nn,也就说进行了降维8 u" [1 J" L' Z9 {+ o
h i j ∗ = h i j ( ∑ t = 1 k h i t 2 ) 1 2 h_{ij}^{*}=\frac{h_{ij}}{(\sum\limits_{t=1}^{k}h_{it}^2)^{\frac{1}{2}}} ' m: }. r7 _) ]0 ]& oh # u, n5 S6 Q% m. L$ uij# H! j' l# N4 o, |4 i' J
∗ : y0 W5 R6 c& d ! f/ }* N, K0 f+ d = - R8 j) v, Q% g4 b
( , D+ y4 N' T1 c0 R+ w: I0 c
t=1! t) E) a2 T/ F+ F6 d
∑9 [5 l% o% J; a, C
k : W) ^ {3 ?8 g# l2 C - M2 u* d5 S4 A* G h ! N8 w6 F2 R+ ] Z
it 6 C8 F3 P/ @ v4 E- L" v2 5 O- |+ L1 v( v3 N" d& k5 Q7 p 1 q+ _- O! a& _: N/ A6 n0 i" `# N ) . I3 }, x. [2 [. b; b# e
2 + P/ Y4 d( w' @% [3 K# e8 j/ x1 , J, n' `- R. d R, K - ~" y7 O" u7 ~! y6 e( |( q7 X$ G, G
" h: d0 y. Z$ o% j4 Uh ; N! a9 S- ~0 W+ k( c/ k
ij * A% W, c+ ^+ ^* |+ f9 c' ]. m9 p$ ` @' g( h6 ?; L2 K
0 Q; a4 R6 K( d, J0 I; i- q/ H4 u
8 ~/ c. u( b3 Z% Q& Q
% ^* X9 u" Y5 q0 g+ k, A
+ ]( r8 O+ E& X这里需要注意,降维后导致得到的指示向量h hh对应的H HH现在并不能完全指示各样本的归属,因此一般在得到n × k n×kn×k维的矩阵H HH后还需要对每一行进行一次传统的聚类,比如使用K-Means聚类2 Y% b4 L+ W. ^% \ R
1 d, {& Q2 B6 z5 z2 `# W
(2)规范割(常用)' ~; _5 S- e w. `
规范割和比例割类似,只是把比例割的分母∣ A i ∣ |A_{i}|∣A / u1 ]# Q, L# Q' A4 O7 y( H; Z, |* D/ c
i. a" I. b$ U c4 v) `
$ m1 ^: q# ]- T, q ∣换成了v o l ( A i ) vol(A_{i})vol(A , `* ^0 B- n$ t6 O0 F" J9 c
i+ c, p2 j. q, B
T' @/ D" \7 A6 t' m
),定义指示向量h i j h_{ij}h 1 i& G* y7 U8 D0 g/ a) I9 \ij3 ]- ?7 r6 w7 Z! T2 Z
+ q6 Y( |, g# O" [
如下 $ A+ D9 j$ t- I$ ~ 4 \: T% {, ?! J: q t" m& a) M- Dh i j = { 0 , v i ∉ A j v o l ( A i ) , v i ∈ A j h_{ij}=; B7 @: G. c7 V2 F6 x. Q! Z
{0,vi∉Ajvol(Ai)−−−−−−√,vi∈Aj% Q+ G- M1 ^0 E; m0 }! Y! n) h9 v* C
{0,vi∉Ajvol(Ai),vi∈Aj9 l- u+ |4 _0 I* h* V5 t" R, O
h ( S! ?$ g& a: n3 W; z6 }' Gij) f4 f8 M- d, X% }# N
; G. [( r% `' C# R* P' Z$ t ={ ( c5 [# P" p, ?$ x6 C0,v z) [" G4 _/ j3 O' d: ri 3 ]7 x3 m, L( g3 w0 H/ w9 D & F |# ]& L7 t* s: z9 B1 ~6 M4 ^ ∈1 h7 N! Z9 Y: ], S
/ 4 j2 }8 B# x9 }" rA ! a5 _# Q' F& {% ?0 ~9 v. y
j $ B7 j: W5 \, Q, \- b. H" ~1 \3 b! I& f) ^
% X/ p1 S3 C. C/ t- i
vol(A . F7 s6 @& v9 F: A6 N( [
i2 s0 I9 @5 g( p
0 j% P3 {3 M' P1 d, g6 ` ) C3 A( i, k, M! D$ S
9 A1 R% h) s/ W; @
,v - s0 ]7 Q. h( \
i; r& ]7 S, h$ i
J7 l ^$ Y# x& J) R! D/ \& q0 X
∈A % m: E9 q9 j: R5 i8 e/ {
j3 ]& K: c/ a7 C; }$ f6 m5 Q
6 R" |% u: j! P5 w0 a
8 B: r% M% u- N. G
5 l7 J$ U0 O7 l$ T/ |
0 u6 y- Z c8 d
! k4 k3 @" Z% P$ G! c V于是,对于h i T L h i h_{i}^{T}Lh_{i}h . V! S6 R+ S$ G m, X6 e& _i* D) s. { j, V4 O3 S! O7 x
T ! f3 B" _" d/ r2 l' z0 c1 z9 o6 A 0 Y0 `& M, e/ }+ g u8 I- b Lh 2 M6 E; r* _/ w% r* w/ L! l
i 4 x- y& }6 I" Y/ O, Q2 S/ t: _5 I0 R% H% {9 S
,根据拉普拉斯矩阵性质可知6 { c# w; z8 }6 }+ ]6 x- \
$ E' C. @8 ]9 N0 w
对于任意向量f = ( f 1 , . . . , f n ) T ∈ R n f=(f_{1},...,f_{n})^{T} \in R^{n}f=(f 6 u- v% [4 i! U2 I11 H4 b [1 M9 V) a$ X9 q# n
2 w3 L1 r y6 d0 j" w" ?6 a
,...,f + R' O6 M( v" q. C, v! e
n : T& `9 v$ q/ A& D/ _5 {* S * I, p1 D% n5 b a; E& { ) $ D+ j6 }* e9 h o
T* K, [. X* S, `" ~* @* S
∈R ' t6 T3 [! u8 W9 s
n 5 y4 t7 V5 j: N# z8 O ,有f T L f = 1 2 ∑ i , j = 1 n w i j ( f i − f j ) 2 f^{T}Lf=\frac{1}{2}\sum\limits_{i,j=1}^{n}w_{ij}(f_{i}-f_{j})^{2}f 4 U- V$ B6 Y; P; a. m( p: B2 oT : q7 l- Q, G$ s4 T4 s Lf= ( I- j' |. w8 F. S! B20 D2 Y* E Z0 v9 g
16 a7 {0 K4 C& k9 [! ]- U
& ^, Z) l0 h5 e5 Q! e r3 q! x ; f: h6 P2 B+ D4 Y+ ci,j=1/ L" W- J( U+ l, S9 h9 J
∑ , c2 t* ~3 a5 g" R7 T8 fn 4 }; s/ |9 J1 a; }# W. u/ T( J8 x/ r4 d' `9 m/ J# M7 H
w / L+ n3 V7 i: c% ]7 Qij ; X2 k' D; R( k$ z0 j9 a* n- U5 M$ n9 z$ [# S0 ^' x
(f + L. T. V- l$ K' I M- M) `i : M+ n; w/ O# l( T4 y $ u f, P- p1 }, J! o" p. t −f . s0 B% p, }. G. Lj 5 W6 N0 ]; ~4 f! J, ?5 y6 r( @1 }6 U7 E4 @/ n, s) b
) 9 d, |1 K# f; l5 f- ~- V3 A2 : b# T5 e# H3 o# f1 }; k9 I _& _9 @) v- h9 q4 g+ [# L
h i T L h i = 1 2 ∑ m = 1 ∑ n = 1 w m n ( h i m − h i n ) 2 = c u t ( A i , A ˉ i ) v o l ( A i ) h_{i}^{T}Lh_{i}=\frac{1}{2}\sum\limits_{m=1}\sum\limits_{n=1}w_{mn}(h_{im}-h_{in})^{2}=\frac{cut(A_{i},\bar A_{i})}{vol(A_{i})}6 s' l0 i4 ?! f* e7 R% [) I
h ' q3 l+ b0 Y. i, }0 i8 Q- t: _1 i
i . H. |5 [6 Y* e7 tT / {% Q- k% r _4 g4 {& h 5 ~9 ?# ~8 m, K Lh ) F7 w1 p& ^* B: z; z, G
i5 w9 s) d7 n; D$ r7 Q: [: y3 G
( G$ y: f; `( ]* |) S# J = 9 D9 Y" Y0 l/ T2 X1 v2 : C8 h* m1 o9 U# `- T1, C; P0 Z# K8 c5 P' ?0 ^+ v+ @
4 ^* @& y. h/ ^( R8 U/ `& @) @1 M. U : t& q! @ e+ v( M5 bm=19 t* i$ T# U: t# a1 U% O; H3 U
∑$ u% Q6 b: W0 D1 n- w
. j2 E/ y d! c: F# _9 c' e # P: @) V* R! w# k/ Hn=1 6 m, i+ U2 j! d" X∑ / Z& v& F; S, K1 N# D& u0 w1 o" { " R6 F8 v5 u6 @& b( R! E w ; b; c# i( e7 A; L9 N* ~4 |% ?mn& H( H1 l( n E/ U$ V3 L, K# J
7 W. l+ |! x: q
(h 2 H& \$ W7 R- q, o5 r) Y: {im * u& n8 |( q0 O/ u4 J7 o" d G3 o+ g" A6 C* w( X, L; V' j
−h 1 p5 | s6 Y+ r1 v8 B& |
in ! h, [) S" M* ^( w* z, n / v! [2 d- M" {! Q ) ( F4 b# `# i# M3 Y: k6 N ?- w- p
2% U& J, F8 t3 S: b ~
= ( Z2 {$ A# ~% s7 h5 J# Kvol(A ' ]6 s0 M( |. d# I0 i$ k a
i3 A/ m; A" Q& Z: N# {0 x
( u/ t# h" M% b4 N1 x8 r
)$ e( B6 V: _( e3 [7 b5 C
cut(A + M2 }2 L% G: ^) R! _2 B3 }: L
i9 ]1 n: K$ x9 z4 L8 b' u' \( [
E0 t3 r% H6 {, q; p. ?" e9 Q4 }/ k , + n6 F0 W) Y! R/ v
A # U# u& u9 _: }' D1 b- x& s/ bˉ & N X7 f( n# t* v; E0 K5 G# p# A1 f
i! l3 p C2 _3 l
7 K1 B6 T: J$ D4 Y4 W6 m: q* _ ) + k5 ^( [; C9 z1 K- w: B 3 g7 h0 [6 s- T# I6 r$ d$ O4 l 2 X- v- R3 M& K% V) c # w+ J4 l- R/ ]9 a6 R5 x) }; o' J严格证明过程请看刘建平博客:链接 3 y3 \" ~0 ?2 J' K5 `7 G$ t可以看到,对于某一个子图i ii,R a t i o n C u t RationCutRationCut就对应于h i T L h i h_{i}^{T}Lh_{i}h ' A) J) C, m2 z7 o# _i( |/ F5 |9 Y$ T# k" c& p, T" ]
T 1 E/ z; E8 R5 s" @7 ~: ]+ M2 t" T% X$ S
Lh ' j) y3 R6 k; L+ A/ A; Yi# g0 d* ~5 C) I( u! Y/ ]: e$ b; @; M
) d* l0 [; a' P3 {6 w; Y ,那么对于k kk个子图; S3 M2 [: C6 D5 T
; f, O* ?$ C( ?) W0 c& P1 p# U+ @N C u t ( A 1 , A 2 , . . . , A k ) = ∑ i = 1 k h i T L h i = ∑ i = 1 k ( H T L H ) i i = t r ( H T L H ) NCut(A_{1},A_{2},...,A_{k})=\sum\limits_{i=1}^{k}h_{i}^{T}Lh_{i}=\sum\limits_{i=1}^{k}(H^{T}LH)_{ii}=tr(H^{T}LH): r7 X, G( k+ u* \
NCut(A * s# R5 f+ [6 K& `/ q! M% J: S- |2 Q
1* N, ?* M! H2 p/ x6 K3 f( E
5 ]. [6 w# k/ w; p% J
,A 9 Q% A2 \# n& L8 y9 B( L25 K$ N" f0 i& r( f4 m
! D' x8 t- z$ X6 g" ?$ g
,...,A 0 ~/ T: T6 {) A% g/ `1 z
k/ |2 X' | o1 ^0 g8 Z
/ f. Y$ ?4 j; i1 `% W
)= . {( t& P4 M7 S7 d: S( f; M
i=18 e) A& f# i9 _3 z1 M/ l+ V5 Z
∑% O! `. Y; L1 G2 y: H) G# o
k ' F& g% S9 @" C( F ) K# y2 p( k0 ] h ) M1 Q- y7 x4 |$ @$ ?- o: y
i * \' }8 m+ z+ q# J$ R, JT ! M0 e) L ^5 T8 i- y 2 E) M6 ^: Y4 i. P Lh * H8 K1 A* S" V0 r' G+ v2 ]
i9 F! A% d i' l# S
6 h0 s9 n6 |( U& _. p = * G1 e- g$ p5 ]8 U' w! `* Q4 b/ {1 d
i=1 ( _! y: m7 _: C5 ^7 h& T∑& K3 d! ^/ R7 @9 @* k, \
k 9 u! J- S! C0 D+ a+ h- \+ Z$ o, T; S: q; c
(H ' o$ y, G9 _+ }- RT 0 G' T& q! `; W) d LH) 6 U& A# b" T$ \: _5 w4 S
ii% R; H: @2 y/ I* a
- L- j; w3 S* p. H2 Y
=tr(H - n7 z+ l3 N. r# c8 u; n* T2 X+ z; u
T . b7 l. E6 u( h LH)3 ~% Q9 e6 }+ E; f: f: J6 G
/ a% V5 l8 Z9 ^4 d" V) F
但此时H T H ≠ I H^{T}H \not=IH 6 T2 V% a7 S& B/ e" B- O# z
T: W1 Y* y# |! x+ y, c
H' F2 ]1 t9 O8 m' }0 I2 u
' F; h) \' q, a T y# L( \=I,而是H T D H = I H^{T}DH =IH $ Y) \: x" J$ W" {/ I4 V* ?6 q. a& tT7 _0 k: e- X9 a- A
DH=I5 D/ y( D$ J3 E1 W- R
2 Q( x2 L$ Z: f* X
这是因为h i T D h i = ∑ j = 1 n h i j 2 d j = 1 v o l ( A i ) ∑ j ∈ A i d j = 1 v o l ( A i ) v o l ( A i ) = 1 h_{i}^{T}Dh_{i}=\sum\limits_{j=1}^{n}h_{ij}^{2}d_{j}=\frac{1}{vol(A_{i})}\sum\limits_{j\in A_{i}}d_{j}=\frac{1}{vol(A_{i})}vol(A_{i})=1h 6 ~: ] K0 R8 K2 e# @9 k3 b
i 7 Y8 W. h* a1 W' w0 w4 y0 T# T, B2 `T w) Y& P5 f+ X* E; S
& z c" |# K& U2 F% p Dh , ]9 s% g7 n0 A' {
i 0 w( f9 u( }: { Q/ L9 y: z; {0 N& ~" A( {
= : K# X$ S3 S! ~9 D7 T# p5 fj=1* A& }* F9 s; j& x- q9 M
∑8 q: B, ?: Z7 ^ U8 Q. M
n . F3 |! ?3 Q: P9 i, v, d2 s " r, J# d7 G( i& I: K5 n h ! x6 @- m9 S' {: C
ij : ?6 h& o( Y* S24 E7 V8 E, b/ m# l5 U2 C( Y
6 n6 F2 t+ `% H
d ( U1 X% Q% O' Q5 _( Fj& f, S/ h" ~6 n K5 b. g: g- C
7 K6 C8 } [2 d0 T! t = 3 H' I, m3 A; e. M/ j
vol(A ) z. g& b. |+ ^) v$ _1 i1 _9 Di 9 H$ a; D. a+ R, o* q, @# d2 |8 D8 i \/ S+ |& h, J t
) ( o$ ^* C. Q0 t. E9 X' R1 - c$ t* P! b, y7 Y5 L% Z* ^% m. U) Z, [
6 | v1 {- k' U4 L+ ~8 V
j∈A 1 ^+ k* |* u$ si + |" A0 o( A/ Y( E # R( C) L, m. F/ n- o( v% w0 X7 ^1 X- C! G) ^) s
∑& E1 [# C, J7 [8 F; z1 m3 K
* t: J; E |7 F. g d # N2 s- X, m' f& P, D% r
j $ H ?& z N$ u4 K. _" q3 {* K( {- g3 M/ a3 H7 f
= . Q! U X2 f# x# r- h
vol(A 6 O) t# `3 a8 h( ~2 \$ K' J0 R/ si8 J8 A+ O/ s0 K1 Z: e R7 V
; B" b3 |4 A% m9 n5 ]- P; V
) - f6 ^3 W+ P1 z, e' _1 X: g1! T+ S& x7 W p& k
3 F* D- e7 f, d* E& ]7 Z' r& F7 O& P
vol(A ) N$ i) D, g4 {! m6 Hi , Z* Q& O. }& S6 W1 W " f$ q7 L( N5 z* w- B. w4 D, A )=1 , R4 E% U" g* ^* M因此,此时切图优化目标为5 |1 B; G6 i9 M- o0 J
4 `3 [- G3 f/ Q- ka r g m i n ⏟ H t r ( H T L H ) s . t . H T D H = I \underbrace{argmin}_{H} tr(H^{T}LH) s.t.H^{T}DH=I 8 L8 u; a( ^5 Y k) E) ~3 CH 6 S0 M- B* B1 O3 P8 J' ~argmin% m' A$ w, L+ ?+ r1 N; W
: X: P9 i) e' ` C3 `' S
0 O3 b6 Y/ ]) E5 [ ~" V& d4 i: o. |1 S tr(H 1 ^+ |' j2 i! _& L) n
T + c$ w1 Q9 G; _, O+ [. j& { LH)s.t.H 7 e3 \% _7 _" a# O/ `* ~; `
T3 R8 p) K% G8 f& Q! [1 g/ K
DH=I4 b. B" u c! F
) Q# w2 l. g3 t, \5 W$ V但是现在矩阵H HH中的指示向量h hh并不是标准正交基,所以需要对H HH做一定转换。令H = D − 1 2 F H=D^{-\frac{1}{2}}FH=D ! g# ~: K* O/ Q% ?
− , i3 \1 }: G6 a2' @, e1 f+ b0 O- F. K! Q q+ ^) Y
1 5 W; j" U# c+ }7 m( Q4 N p ' H! A" t8 g* Q0 H$ m1 V: p ) ?' j5 A- G! B) G/ n3 t F,则H T L H = F T D − 1 2 L D − 1 2 F H^{T}LH=F^{T}D^{-\frac{1}{2}}LD^{-\frac{1}{2}}FH . w- J9 `' u& y2 E9 l5 y, i* BT9 Q6 G/ U Z1 A4 I
LH=F : v/ D* k- j/ K' lT3 R3 j: m8 U: B `
D 4 W- ]" F7 v2 J k
− 3 _* f3 ?1 Z: `# m/ e, G
2 & E. ?, c3 {6 c1 5 ~8 |& ?) b3 J% z 0 H9 z3 i: {9 H3 }% {" k( L1 L! M0 M3 I+ m% d- P- \% |0 a8 ^' r- N* P, k- M
LD 4 h6 i V0 J: m8 A8 e
− * H) y2 w& b' U5 x4 X. X7 N/ U2 ) e8 H8 o4 @3 [8 [2 k9 |1( O& k. v$ Q5 _
* b) j* r, ?: j, Q2 F$ ~
/ h- H& m# z5 ?8 L$ i2 g
F、H T D H = F T F = I H^{T}DH=F^{T}F=IH & h4 u& Y u# `$ y6 A5 P# a! qT9 [% \2 v5 g: L& |, S: J- ^
DH=F & K" n) @. L- ?( B: r% V8 s0 N0 @' C+ @T7 U& @6 E8 n( R: C0 b$ o
F=I,于是优化目标变更为" K- y, w% o8 V" u
a r g m i n ⏟ F t r ( F T D − 1 2 L D − 1 2 F ) s . t . F T F = I \underbrace{argmin}_{F} tr(F^{T}D^{-\frac{1}{2}}LD^{-\frac{1}{2}}F) s.t.F^{T}F=I : J3 F: m! b# N* O- Z7 CF 0 c/ }8 n( y7 Nargmin 5 m! W( z! \$ G7 p+ q# D% j ! I" [ ^: Q7 c9 P7 E9 ] n5 k: g ( v+ c! f1 W5 [9 S! Y: {( E8 c6 R, S- F6 Q" E3 b! H
tr(F % L) p! ^0 l+ ?) ~4 b% d, h
T ; y( O1 x& G8 s; D+ a D 7 _4 H& ^! e7 W6 @$ p
− 4 R6 z: Y) \+ S& F2 ' @4 x x( [. r1' w% y3 W$ R! q6 m1 E
. V K3 X2 H: T& s$ t- i' G * G w- j1 i( X LD ) P( r! s! C3 B$ n% I− / W7 U* n2 W6 g7 v" |# z' ^8 Y
2 Q4 K2 P( x- c( D1# m8 A- U* S- M9 d' z c
, I8 }$ i" C- I! U. y( m2 V& l
* Z W: y5 E, X
F)s.t.F 4 ^& m5 j% |# ]6 R
T 4 V8 q+ v: w) l) z" g; l F=I5 a7 F" g5 K9 ~
7 D+ ]8 `7 G; q* A. I; j- t
现在,和比例割一样,通过找到D − 1 2 L D − 1 2 D^{-\frac{1}{2}}LD^{-\frac{1}{2}}D % I9 e( Q5 G3 d0 M
− 7 u J0 |) o9 G7 X; P5 D6 L. m
2 ' r/ x; z' a& t& w* \1: u" T* U+ _% s* J3 `2 S2 v- d. R
~- a4 P6 w: w. ?3 `" y$ U! `# [' \4 V
LD 6 ^1 E5 R, Q3 M, e2 [3 ?− 3 y5 w6 h, a% C0 y2, D9 j- b( `, ~- C. X+ n4 p8 o$ m
1 5 ?9 n% l, `0 r" z2 a 8 P, j( Y0 v: H" `6 \2 m. U$ \- C F3 W! X+ j
(就是之前的L LL)的最小的k kk个特征值,可以得到对应的k kk个特征向量,这k kk特征向量组成一个n nn×k kk维矩阵,也即F FF,最后对F FF进行传统聚类 w# D' L( I/ |+ M
8 ?& h" W4 ~7 b1 f7 x: v一般来说,D − 1 2 L D − 1 2 D^{-\frac{1}{2}}LD^{-\frac{1}{2}}D $ d& {. x( M s) g- O5 L( z
− 1 o' d$ i: ?+ d6 j* ?7 y/ O+ ], x
2. n4 v/ I+ D3 d4 `1 `* B ?) U
16 S: q: R! P" r. ^! l
7 E+ T. [. ?% }/ l- Y [4 o" Y9 Z 0 F4 _. r2 x" A5 k5 m ^5 S7 P LD 2 |9 V1 u9 A9 ^4 S− : u% l @+ i6 n0 s& X, z) @5 c2, G. E9 P& V6 _7 q: b1 d- @
1 & D& v& v& R) L( F: m6 m% c' z2 q
+ N# R) s% z, C! W$ \ 相当于对L LL做了一次标准化,也即L i j d i ∗ d j \frac{L_{ij}}{\sqrt{d_{i}*d_{j}}} 1 M7 r6 u3 A& b v3 J" h
d " [* U S( |2 P1 n" I0 f# S' e' qi( _7 d. ~1 R1 d2 O! d
1 y, b; [' u( E0 h9 u& t4 W# j" R8 w ∗d 0 G& _# N5 b+ r5 H1 [; H0 [2 p4 y( j
j ) t- T% x" ]: K5 K" Z7 M) w" G# n: [ w; v