) {* c( \" q$ o2 E. L, i于是,对于h i T L h i h_{i}^{T}Lh_{i}h ' X$ q: U) u" E' x! }
i# {6 j8 W }7 o+ t
T; D9 D. s, l9 I# b0 T ]
& q6 G) [3 z5 E4 ^0 S
Lh * a$ I' |" G# [, |! v/ O! T
i ' j/ _/ Y% S6 i# o0 w- Z' b, h 6 f) _8 {0 ?3 @+ |- `5 v ,根据拉普拉斯矩阵性质可知$ E. p4 b7 u% H2 x
8 v0 {3 J7 q8 H, F$ d6 d对于任意向量f = ( f 1 , . . . , f n ) T ∈ R n f=(f_{1},...,f_{n})^{T} \in R^{n}f=(f 4 L$ V4 K6 ]/ I) x5 D6 W0 H/ z15 s& s. _$ p0 g5 e$ t" b& `
$ A# X* A# p3 M6 O
,...,f / q- u; H* Q+ y; E) V# ^# Wn 1 V! L' T+ X9 Z1 y; g: I $ u. o+ C# ~7 I8 k ) E" Z# f7 v$ C* A% L! S* ZT2 C7 o+ t0 M# K7 J; P
∈R ' X% I8 A, I' vn8 y* a/ p8 ~4 K& c$ ]% a
,有f T L f = 1 2 ∑ i , j = 1 n w i j ( f i − f j ) 2 f^{T}Lf=\frac{1}{2}\sum\limits_{i,j=1}^{n}w_{ij}(f_{i}-f_{j})^{2}f & P! Z' D0 R+ C8 o3 \3 F( R; }; p- oT# `: B! f6 a9 {+ W1 o. G
Lf= " ?) k- o. w- d8 u- b0 X' j f6 D Y25 F/ E2 u1 v: Z$ o' b! e' m
12 d, h& I J8 I# e1 R
( ^& @& s3 Q9 [
4 {! ~- U' ~, P' k9 R
i,j=16 H$ u6 k+ N k! C1 Z
∑9 H: `9 `, C5 Y- ]
n ( N) u# h( m2 f. V4 E/ M) _ 5 }- @7 L. Z; T( O0 B w ) h w* ~2 a1 s% m* Eij# v7 W9 G( j9 b* N
6 C8 o9 ^ J. w5 h' ?
(f 9 e. O$ v1 T c$ L/ b# Hi! S% i6 d1 m0 r3 L
* t8 `' O" M3 R/ d: i- w
−f 1 G, \$ I8 Z, b" W% Kj" Q3 ?5 E k6 P3 k" b# u) n
/ R! j9 C+ e( u! p ) ' G4 m- I+ I, B2 ( I: w/ u' k& B # B/ z0 c1 z; Hh i T L h i = 1 2 ∑ m = 1 ∑ n = 1 w m n ( h i m − h i n ) 2 = c u t ( A i , A ˉ i ) ∣ A i ∣ h_{i}^{T}Lh_{i}=\frac{1}{2}\sum\limits_{m=1}\sum\limits_{n=1}w_{mn}(h_{im}-h_{in})^{2}=\frac{cut(A_{i},\bar A_{i})}{|A_{i}|}7 z. q+ O6 y6 {. m! I
h - Q; a8 U$ d/ z& A
i" ?) X6 U) `2 E/ D. c o0 v% J
T9 W/ q/ u9 G- [" [
2 Y5 c+ c' D# [6 r/ V- U1 F
Lh ' |, j3 K O$ d$ @$ Hi" A- ]- Q* u# h, ^
7 t$ z0 k& ~# n$ B0 L* b8 A
= 5 B( n; J& s. c9 ~$ M' s2( u$ d7 U, p& d% X, [( [) t- ]2 _
1' ^3 f7 N. H2 d" a+ B7 }0 v" i
1 [- d# ], e5 ^9 r
3 c( x+ i, h1 ^* J) r) i2 w+ K/ k/ U: ^3 Um=17 _( R, S) ]+ a z& b
∑- z( S. d5 o. C4 m
& J; N" |* n: |
8 u5 J: s- w; L7 [n=1 $ c! v% [9 M, v7 S. m3 T∑+ K* y; e& ]& O; p6 z5 }/ ?! h
N: f. K7 j& A4 D6 ~$ C w $ J& c) n2 f" X7 K, e+ ?
mn % R, W ^/ I% A7 l$ \# s0 S' S$ r1 g" G
(h + b: h+ _' g+ j" c& Vim# V+ F% j0 W8 d
& R8 @( }/ K( J ? u0 C# @ N% z& V
−h 6 v; k6 p c2 s( b
in ) N9 J7 }+ c8 Z4 _6 H" H) o. n$ H1 z
) & d1 ?: n+ P: w$ W
21 B% z$ J: Y6 m
= ; U- V0 {* _4 u& ^1 c" T, v1 o6 z∣A " h1 P4 ^2 W0 h2 r" ~6 \
i$ K' x I8 q! N! ?) s5 G" i
6 h$ m. e, m' @: {* C ∣" g/ [$ v8 R$ C9 o; q: s
cut(A - F: E7 i' ?/ Si) E5 D0 X- k: j; A& k
$ Y, H8 a5 W h( V' H , @: x8 a" r8 ]! \" a
A! c5 v- J4 F! l. _* t. B
ˉ) g- I% z" \0 k. \8 e) O. M
1 Y; B U9 W# E6 ` s P3 @
i ; `5 P1 ?. _% C' q P& {. a |9 z/ V/ z+ V- T, _
)9 P7 N. u9 i* M4 x
) P0 n/ r& G6 U( V
: N6 [& N2 V1 Z4 F8 |+ s' q; r+ A # B* u. N; j, O! S; C6 X% j+ W& }0 p严格证明过程请看刘建平博客:链接) I1 W( D4 L0 w/ _$ g5 G% `5 Q2 A
可以看到,对于某一个子图i ii,R a t i o n C u t RationCutRationCut就对应于h i T L h i h_{i}^{T}Lh_{i}h ; \+ U! E; _, ^
i$ Z* @7 z7 @9 C. }5 B
T, d, B: m6 X5 j+ x# l9 c' O4 T
7 D- m; s' \+ M Lh 7 N" z% A# z* k) s0 L
i) m3 N7 [, x/ @7 ]( t3 x
1 H2 [# w3 X% D* n. T3 O
,那么对于k kk个子图 * L2 q& r1 d/ Z- l 9 h- O1 g% v5 g! Q, nR a t i o C u t ( A 1 , A 2 , . . . , A k ) = ∑ i = 1 k h i T L h i = ∑ i = 1 k ( H T L H ) i i = t r ( H T L H ) RatioCut(A_{1},A_{2},...,A_{k})=\sum\limits_{i=1}^{k}h_{i}^{T}Lh_{i}=\sum\limits_{i=1}^{k}(H^{T}LH)_{ii}=tr(H^{T}LH) & ~. l: P- l. |) CRatioCut(A 8 h5 K+ R$ K4 B2 P; b' C6 X5 m2 j1 ! t1 x) t) \2 Z" Z, t7 O) N* Q6 C9 j& i" p. |3 y
,A % z: k6 }' }* z2 ) I) H4 w0 g) H% r$ V5 ~1 J( G( X/ p. `. [7 P
,...,A 6 F6 b) k4 D( v; R+ W6 O) v. Kk ; t. S& v) c# u" E " @2 R- i9 i; u )= ! @- g4 V+ p4 o- `% yi=1, ]/ t$ P, I2 r
∑ ' s+ i- f+ W7 W3 S F wk7 T2 k' |" l$ F5 M- J9 H: [
3 R, s& D4 {$ T4 C
h , b* M% h H( N9 W& j- {! A
i * B1 |5 b/ J# K6 WT + y. U7 F$ \' U b* L9 W( H5 y V9 l( \$ j0 Y" q4 ]2 S% s4 k! v
Lh , a; ~9 W" Q; ^, `* g: A3 Li9 r- f$ e+ |, X* _( \! K
. u$ Y8 W$ n" n" [. ] N
= , ^, V7 i6 |5 }, c: ?i=1 ) U: O; T; h8 l$ A% A" ?∑ / U7 e8 @# t" P) U2 J# T fk$ R( ^7 Z: Z+ Z1 w. U/ ?
. L0 O r6 h! ]2 _- q! r) ] K
(H . l2 n7 h, D1 l% S, j
T ) m% M- _8 B, r1 X3 B. ]2 c$ T LH) 8 g/ E0 J a. Z; D- N* S2 N4 Nii / m# e, e5 c: i' B S8 J2 `4 w$ o8 d, h: s1 f
=tr(H 6 w) d }# c6 A. o8 q0 [( mT7 R V1 A& k6 c5 `
LH) . L' Q/ P0 [8 B+ { , i& E7 a+ W0 M, Z因此,R a t i o n C u t RationCutRationCut切图本质就是最小化t r ( H T L H ) tr(H^{T}LH)tr(H 4 O# o$ P8 V# O
T 5 N$ p0 O- Y$ ]6 o* ]( q O LH)。又因为H T H = I H^{T}H=IH . c* V0 `0 M! ^- |' y$ P e& ~ Z+ CT 8 H4 F. q; q! \ H=I(单位矩阵),则切图优化目标为 5 ? A' v5 ?; s1 r& }1 Q3 g* Z* {2 j( q
a r g m i n ⏟ H t r ( H T L H ) s . t . H T H = I \underbrace{argmin}_{H} tr(H^{T}LH) s.t.H^{T}H=I0 P+ d- C+ E7 L: m
H # Y, h, Q7 N. h4 a* J" Kargmin4 U. z+ j# d) \3 c6 O) q$ ?$ _
( Z' O" N* y" c0 r2 u$ I/ A' f$ C+ G! E2 x/ f1 }5 ^9 L
$ F, I) U: g) S0 H Y, e9 k5 Z1 L
tr(H 0 J- h3 g x! n6 ]+ O( b
T b% n2 v! ^" r6 Q: o$ A
LH)s.t.H ' Y' P; l4 h8 i
T ) r, Z0 R0 A. a' s6 Z+ u* o$ v H=I+ l( E# t7 N9 e- ^+ _" s9 Z; {) ]1 `3 e
/ E, N6 \6 Y$ E0 ~7 k- V! ^对于优化目标t r ( H t L H ) tr(H^{t}LH)tr(H : J t- s) W; y P: I1 J3 O6 J+ i
t 2 j7 ?/ K3 a# @( @! i7 N LH)中的每一个优化子目标h i T L h i h_{i}^{T}Lh_{i}h 0 H `% w4 B% t6 b5 c1 S
i# R6 P) r3 c- G3 Q
T+ [. X+ v; I" \
* [( s( ]! f" @ | Lh 2 a2 n+ X) ~5 K& p3 A: pi% [2 \- S! |/ g* g* N% N$ e
* b) Y/ V1 E4 R# D' x8 G8 V6 M/ e
,其中的h hh是单位正交基,L LL为对称矩阵,所以此时h i T L h i h_{i}^{T}Lh_{i}h " J0 z: s! K9 y
i 0 {0 s W& N! S3 IT* X% _, t: S* P: Q9 L
1 t) D5 b3 y5 q$ z% i
Lh / p5 b V. \9 t* M2 r) w: j* t/ P
i+ r6 r5 ?. j. m1 r' E5 V/ `
2 m8 x3 |- I3 N( R' ~% k/ D3 N
的最大值即为L LL的最大特征值、最小值即为L LL的最小特征值。而在谱聚类中,我们的目标就是要找到目标的最小特征值,得到对应特征值向量,此时切图效果最佳。所以对于h i T L h i h_{i}^{T}Lh_{i}h 5 ^" q& X- W9 u4 c. x) x4 g
i 4 B; f+ G' I1 GT) i Y0 L4 f* P1 c1 u
! y$ D* ?: m3 d2 y Lh + s& Z0 Z1 d ?1 f
i. b! A% Z5 o* }! I
8 x3 f1 m" \' t ,目标就是找到L LL的最小特征值,而对于t r ( H t L H ) = ∑ i = 1 k h i T L h i tr(H^{t}LH)=\sum\limits_{i=1}^{k}h_{i}^{T}Lh_{i}tr(H ' V) {2 E4 a$ A5 } n$ `* p$ ft8 m6 b0 l6 x5 r6 \9 g# ?3 f( X
LH)= % n5 {, x4 t; [( P4 j" mi=15 _! K. m. M% T( n) o& n
∑ - S2 ^2 e7 r1 a9 zk , i7 }' V7 \9 m . F- D/ j0 l& q) f( k- |# | h 1 Q8 Y( [9 ]7 }; R0 \- L7 v) s. `
i , O2 F" S( t4 E5 h8 Y+ R9 C+ aT# o$ r9 P" M5 ?& o* K5 w' q2 Y
3 w; B% g, Z: _& u1 `: c6 E Lh 7 \! C4 n$ \! O( x; S
i( x6 `) q# ]* B: r! y$ x
. G# W/ q9 s1 H& W ,则目标就是要找到k kk个最小的特征值 ! ]! y- y# r- N/ Q; Z $ p9 e& B, X0 r: o因此,通过找到L LL的最小的k kk个特征值,可以得到对应的k kk个特征向量,这k kk特特征向量组成一个n nn×k kk维矩阵,也即H HH。一般需要对矩阵H HH按行做标准化,如下% B- O# v2 Q( _5 A, r; {# ~* T5 @
( P/ {8 x+ n5 H m, U- j0 O" u3 J
一般来说,k kk远小于n nn,也就说进行了降维 4 P. X( u! X b. Gh i j ∗ = h i j ( ∑ t = 1 k h i t 2 ) 1 2 h_{ij}^{*}=\frac{h_{ij}}{(\sum\limits_{t=1}^{k}h_{it}^2)^{\frac{1}{2}}}) h* W( o" B9 s: x4 n
h 9 y( k) S8 I- S, j" U& s7 J
ij " a7 f5 x- }7 W1 g- J∗ 7 W7 c3 _0 Q$ x* n6 T4 {" V8 ^! E. ]& ^ ( l7 x) I% n7 J+ d! c = : L$ ?4 N$ T# U1 L) e; }% r( 4 h4 s8 ?+ C, m
t=19 [; Q( r( `: Y: A
∑1 y1 B% ?% P' w, L" N1 S5 V3 n% |
k 1 z/ p, v1 W) f/ m0 l1 P2 {& g7 b0 d8 `+ O; F: R; _
h / [; ^1 i; @; a: D4 @7 git ' L5 B* q0 L2 x5 y) u2 $ ~5 X) d- {9 v* i( z* j . O0 O8 U. @) B3 R- f; H& I& {* |3 X ) 2 R9 \7 \5 t/ _* _2 - q7 j5 q9 {( N2 `3 w( i1* J. t g5 [6 k
3 V r5 ^2 m5 ~# Q- \ q& I& T( F1 e4 X
* w: z0 H- x6 V& m1 [9 e# h
h o& U. f' v8 P+ H2 B+ a( p5 p
ij " I9 |$ U2 F8 ^6 l+ _/ T : a" R; ]3 X0 D* ~ 9 _% U0 |3 \8 S8 {* _* {) x ( P# P" h, T" P% L9 k$ r6 k+ N. s& s' L" ^
9 j5 M: z8 x4 F: r
这里需要注意,降维后导致得到的指示向量h hh对应的H HH现在并不能完全指示各样本的归属,因此一般在得到n × k n×kn×k维的矩阵H HH后还需要对每一行进行一次传统的聚类,比如使用K-Means聚类 2 H) Z! w2 ]& C( C. y4 {: v' r1 [ 2 N/ I4 Z. \$ d5 m( f* o(2)规范割(常用) $ h( ^% \* m% W4 W+ l7 K规范割和比例割类似,只是把比例割的分母∣ A i ∣ |A_{i}|∣A 5 c$ e# N( e2 K1 ]% U: oi, I! N) X3 x! y& V0 r! y7 @5 k
) B2 ~* u# \. A K' R/ V3 U0 ~0 Z# W
∣换成了v o l ( A i ) vol(A_{i})vol(A / x1 D+ n3 ^6 a, D& y1 ^( Yi, K: T* `% D0 R/ g* Y" `
: W+ v8 R: c l( Z8 U/ B* t1 I
),定义指示向量h i j h_{ij}h , U% t9 T4 n1 v4 g+ jij " P( L" y, u5 W1 ?9 J 7 e% R, x1 m9 \5 X+ T$ H 如下+ b ?- D9 E# {1 i
: ^- r. ^8 Z: V6 L) b5 a6 j
h i j = { 0 , v i ∉ A j v o l ( A i ) , v i ∈ A j h_{ij}= 1 v1 D. L# o2 y9 [7 K{0,vi∉Ajvol(Ai)−−−−−−√,vi∈Aj) {* _5 h% ~8 q- q
{0,vi∉Ajvol(Ai),vi∈Aj , t9 B' V( h, g0 uh ! m; b( l/ s" I9 V. L: F
ij ( C; x* D1 ]# `/ a; T5 G. n V4 M
={ 5 i" @1 W* F. ^% n& m% Q& T0,v 1 G. s: L& ?& @+ Q
i) q. J+ c) v. m
: t* w% l" [9 S8 {8 ?
∈, K1 W" a$ R, [" S- f
/. h$ u1 [0 \9 @. E& _' b
A / K/ F9 J1 G7 U* \
j/ I- Z% j* O6 f9 U
: _. E* ~& R$ J, T
! X% J u( E4 J$ z/ svol(A 0 Z U7 s4 k( ?9 E
i , F7 Y- V$ W" B$ |" M' y/ v3 l! m' V' s/ H7 R. Y6 m" K: L
) 7 F* { H2 o" p7 z+ w$ @% H F& z# _ |8 x. f0 D ^
,v / P$ y) U& O" f6 Q
i 4 f* k+ @+ m B0 N- Q) {( @0 P$ v0 W! f6 x% \% j) |
∈A 6 B3 p' e, k8 C/ P- E: [5 _j4 a$ M9 x6 s1 y& C! {+ N
+ B( E4 D. }$ ]2 h7 K# A& x& o% k. m! W3 \# A: a
* F1 w. |& ^, ^ W% ^
4 V% S+ r" V$ U+ F& M) ~2 ? - w/ g$ p' W" G# a4 K于是,对于h i T L h i h_{i}^{T}Lh_{i}h / m" Q; H7 c0 d) g; Ji 4 n$ b5 W, T9 z6 G. OT1 D5 W0 t' o, P7 }
8 x& P/ ^+ f8 M4 s' f7 D6 i Lh 4 m; D6 m5 t2 n% D+ ?2 ei / `7 ]" q! j( k8 j1 p, k. j$ x/ |8 t; F- c( ^. s
,根据拉普拉斯矩阵性质可知 $ ^# y* Q. d" Q) f. D5 {! z0 b, J; r7 P- w
对于任意向量f = ( f 1 , . . . , f n ) T ∈ R n f=(f_{1},...,f_{n})^{T} \in R^{n}f=(f & p! z3 Z+ k% t- m9 j5 Z14 g2 \, d+ c$ w+ M/ T, {9 z
0 y* N3 k5 N0 g0 M) B* p' d ,...,f 5 R$ B7 }2 z! }- An \! _5 u4 J% x# E6 }' T* {& D ( D4 M4 p6 s) c ) 8 z' }5 O1 U" q1 a3 b+ _4 M
T2 z! D V# b$ H
∈R ( R- g' d, z. [2 E& q3 y+ E! }' Fn/ ~; R' R% L) l* V& f9 d
,有f T L f = 1 2 ∑ i , j = 1 n w i j ( f i − f j ) 2 f^{T}Lf=\frac{1}{2}\sum\limits_{i,j=1}^{n}w_{ij}(f_{i}-f_{j})^{2}f & {% y% P2 k0 l4 o/ B3 NT- G( L* E% O; F9 s; j' v4 |
Lf= / V( Q( ^! M3 o1 P; x
2# J% s5 L9 T4 j; m
1& K$ J5 _7 z; s6 I& H& q i
* A& l, w# X, _/ ]0 g) J/ q4 V( e0 u. K# Z4 G! b# b' Y+ d% d
i,j=1/ _' `4 e, V6 c1 F
∑. J: R1 W: L7 J! E) w) r8 x7 i
n( @+ Z( c6 Y5 F& ~
" c6 M' a7 \, \0 W5 Q4 n
w 6 W _! p( l3 @+ _; y' g Hij ( o4 P% X7 P- ^4 K6 M- r8 u" o' j8 V1 Z
(f . n" b1 P! u- d" Y: n) m# Hi 5 c4 O( R4 k: w8 E# C: S( Q8 ~ + y# B5 \4 L+ ]0 E −f ! Q4 `: m# a( N5 }! C/ q% pj ; V( t3 e. c/ k! N ~. D Y ! |- R, l: g- u' k ) + m$ L5 \' F0 K2 |2. k$ ]4 E+ B9 k! D/ Z! y
2 i( D1 W8 |' g, ^# Bh i T L h i = 1 2 ∑ m = 1 ∑ n = 1 w m n ( h i m − h i n ) 2 = c u t ( A i , A ˉ i ) v o l ( A i ) h_{i}^{T}Lh_{i}=\frac{1}{2}\sum\limits_{m=1}\sum\limits_{n=1}w_{mn}(h_{im}-h_{in})^{2}=\frac{cut(A_{i},\bar A_{i})}{vol(A_{i})}4 h/ f9 z8 _: W0 a9 Q
h , {# W! K% O3 g0 g0 ?$ R2 L
i - q/ D! [: c6 d; _9 Y# A' eT % `. ]5 q0 _9 S! ^* J % C( v6 ~0 P, W" i* R6 `1 A! M& ] Lh & [) o8 Q* H# x4 l9 xi1 G$ q7 S3 N* s: F% G1 {( K J3 M
; v+ P) y$ P1 n; L = & M9 h# @ h* z; _
2 1 i( \& ~) x8 Z# S11 {9 F) m; m+ A8 W- f8 a7 o
' Y9 q% X4 {" \8 L# f6 F 5 W* _$ v& }8 B# O3 j* T, ~8 |! E& cm=1 + G4 e$ O. E D6 f2 F/ A! u8 K/ D∑ 0 B1 S& R1 g# M- X w4 t ) b) Z. P- e# ~( `8 L4 ~: ` `+ ~: c% Q0 {3 P& ]' @7 d( X. y* e0 \6 a
n=1% D( ] N, j6 g* z# s
∑! v$ c( M5 `4 [/ T4 V9 P
' {1 N( h' K: x! ~! E0 ?8 ^4 ` w 8 f# J: u: l7 M+ v$ b) N
mn) y6 D7 V& I" W4 u$ K) P/ [
% o: Z( \9 {$ a7 G$ A
(h 7 M6 Y. N! q6 fim $ ]0 U# {4 g2 D" \; q+ {1 U ! K; B' s+ T8 ]* C −h % z6 p) O9 N7 q; \, _
in 1 f1 M+ z( F" I- \6 _ 9 s+ J/ X1 A2 n ) 8 K6 Q* b* i) C% o1 V
2# J/ r" W1 F/ Y4 D2 b# B
= # E3 ]% j% ~6 r* z; z! n6 t- jvol(A ; |. \( h5 a* Ji / o. R0 M; d3 C: i5 D3 G4 |7 Q" m. I; _2 w7 S$ R8 x
)* M8 Y7 U+ I7 }& K- C4 f- \
cut(A 0 M) q3 t- \+ a0 W$ y5 ii 7 ]; x" ^- D, p1 ~0 D / z1 J$ Y9 d0 M9 }7 {8 {& K , 9 @- I7 g' p/ Y# j( y
A0 G6 W% R0 \4 z% M/ G$ s- W
ˉ / ^. \4 D" o4 G# |( u% D+ l& ^ ! |5 p) k9 b/ ?& v) Ti , ]1 }1 k: ]1 _. {) |* N0 j% H( r5 ~, t4 W& `7 ]
)4 s& l' R2 W0 a$ J& b
( o! g8 ]+ |7 W; F / i+ ~3 `- k* S9 L N- ` 5 }( U0 n& B7 z, ~( Y4 ~2 F0 e! F严格证明过程请看刘建平博客:链接 ( R# W* A* ^: [: ?可以看到,对于某一个子图i ii,R a t i o n C u t RationCutRationCut就对应于h i T L h i h_{i}^{T}Lh_{i}h % n6 J p9 Q Hi- g" J" {/ N/ q8 N
T5 r+ m( n* c) m
4 E1 c. j" ~3 o& x& B- ^( e! r4 D/ b7 e Lh 4 V! {! Z) S2 ji! w+ J% A1 x9 I7 C ^3 Y( n2 x
; |$ I) C- T6 \( E) Y
,那么对于k kk个子图 7 j1 Q9 I3 L+ S8 e% N ' Z5 }" n4 [" x4 O1 gN C u t ( A 1 , A 2 , . . . , A k ) = ∑ i = 1 k h i T L h i = ∑ i = 1 k ( H T L H ) i i = t r ( H T L H ) NCut(A_{1},A_{2},...,A_{k})=\sum\limits_{i=1}^{k}h_{i}^{T}Lh_{i}=\sum\limits_{i=1}^{k}(H^{T}LH)_{ii}=tr(H^{T}LH)$ X7 e. T) y$ {4 V& l8 E, _
NCut(A * T5 @4 l" a9 w& [
16 k4 b. T6 P$ ~# D# _" R
: c) G" I# T- A: j B
,A ; J6 w) [1 V' N8 O8 A- j
2 - B9 n6 r" D$ F& a# ~+ j: }( g5 a' Y' q
,...,A + _ N h& o% f. L7 e1 A
k" L. v- y/ H+ i! _6 x) {. F& N
6 L4 w- `2 ^. X0 T& |% u
)= 1 r0 C( T+ T x& `
i=10 m7 @9 u% @$ {
∑ 4 H8 ?; Z' o- _8 x7 S9 zk$ i$ Y4 c4 I6 l+ N) b
' C1 |3 j4 m, y h - n! s+ s, b1 \" q( L% K& yi 2 C9 _5 ~& v/ R. h& X" e6 A4 bT9 u' d `& e O; e
6 f* e6 B c/ S, q) P Lh # D- I5 m6 B( h- Q
i/ m" A& a7 ]+ I; S4 P$ B
+ X4 |) E: c M" O% Y = " L$ a1 J" N* m- b) i3 R
i=1 G+ `& b' A# Q1 c2 p9 D2 i) g# K
∑ n6 u; @2 D3 L$ i+ S- Rk* I+ O2 v/ ]" _$ e
: t) K7 Q$ F4 R- d3 ]( }* U (H * d! g* [4 t. X6 V! @( D: wT7 i2 l' {. |% q' j
LH) , J/ T2 N* @/ f' |$ J# D
ii ! S9 ]' J) V/ R. r3 [+ n$ E 2 @' Z9 S6 z- K1 n2 P% s: z =tr(H + c: }* `" W( c
T5 m, c4 a7 n1 C+ S8 L. K4 Q
LH)* K1 c! e" @6 s! y
8 O; s' E: a0 Y9 n. _" G; E, b但此时H T H ≠ I H^{T}H \not=IH $ l* K: b( d% S: ]( zT) Y+ E* L8 c& m+ X
H 2 y- J* q. U' ^( `% `0 s, p Y1 t1 h3 B$ a K
=I,而是H T D H = I H^{T}DH =IH 4 g1 Z- f# @ {6 W( B# D% U
T 4 a% ]/ [: e5 f; y( I DH=I o1 V; t; ~! p4 _
% k0 z. v$ N/ V7 u, A& ]
这是因为h i T D h i = ∑ j = 1 n h i j 2 d j = 1 v o l ( A i ) ∑ j ∈ A i d j = 1 v o l ( A i ) v o l ( A i ) = 1 h_{i}^{T}Dh_{i}=\sum\limits_{j=1}^{n}h_{ij}^{2}d_{j}=\frac{1}{vol(A_{i})}\sum\limits_{j\in A_{i}}d_{j}=\frac{1}{vol(A_{i})}vol(A_{i})=1h 8 h. _, w. Z, v9 ui - B. i* Z; u: j! E! e" p; m0 gT 3 W- F" l& X9 r) z! j$ Q4 ~; m/ |( [7 o2 X! |: r6 V7 u" O, z
Dh $ l, @! D3 ?) R' e7 di : W' T2 D4 {: j3 A. e! Q+ t" ]) x
= 2 w1 A4 R+ K2 _) mj=10 s0 G/ y# Y" P& H6 n* e
∑ - I. p: R; ?1 Z' f, |1 N( _n / U% a+ b3 W* f% Q5 r, [& D6 ]* G% ]7 t3 N. y" F' ?
h 1 g. f# P; c; c+ j6 H$ a' M* K
ij . f$ o- k7 x/ |2 c) Y- H3 Y2 8 z7 {; n _7 G; Y, w * l K/ \+ B4 G# J0 t d 3 Z9 X5 Q5 V' h* T$ `9 ej , I( Z c- n8 V: m- l1 W" s. u0 n% ~' a5 Z1 D$ R" e! s
= * b! f8 j1 ~6 g+ m0 E/ tvol(A 5 f! f2 {4 e3 y Ci 3 T+ m' H, G& r3 {/ o- u t1 B& }0 {/ j- u
)) Q; \: h* {" `7 M0 [- s
1 3 x7 q7 Y7 d0 c3 y, x' L 3 ?- L1 L. P& d6 |2 P( ~0 j / r3 T* t( }, x- X/ Fj∈A ' c& e# y& q& D3 |
i4 L+ A( F6 `0 }; D
7 V+ h9 v+ W; F- H $ N% j+ D+ o1 C/ q. L∑ 7 H! {0 w# @6 @8 \8 p0 ]$ L; }+ n* q$ N
d ' f" @: b% g, P/ O D9 h" a3 T* ]
j m- H& t7 a/ q4 w' o: F& B6 K6 z( g
= 3 L; x; ^) {( a! L. K }, h. Fvol(A 4 H9 Z( L: K8 T5 [1 X5 w. J
i+ t. E) m% B8 H' {: l7 A
, O: n; r& u- L: p# s, I, ~ ) & j0 y4 ~, g4 A0 {1 + S/ ?6 v8 Y3 `$ a: _9 c1 Z9 s ; @2 s9 m# E* d, j, M) _4 Y9 c vol(A 9 {8 M$ w& [, W+ X% R5 y! d/ r
i * k; U/ y* @: o1 K/ A$ H, m 8 t9 S, d. w7 U. f9 V- @ )=1 , }0 y* b! Z. r因此,此时切图优化目标为 6 l0 K; n2 ]0 |: ~7 A% O% a, `+ o' I0 Y. {/ f
a r g m i n ⏟ H t r ( H T L H ) s . t . H T D H = I \underbrace{argmin}_{H} tr(H^{T}LH) s.t.H^{T}DH=I $ x1 E6 @+ t" F1 U+ V4 tH+ Q' c: x T& p% m% N: R
argmin , N( k. B5 d% }3 u4 ^( t$ ]4 g! t8 S
5 @2 d# W! c' p! d! B# S# C' I0 Z. l) x
tr(H ; W. W3 Y. P+ w3 ^8 z1 r6 r
T% _4 W" T2 k% `
LH)s.t.H * V. T& h& v' ?T 7 x7 y) P. G# T6 x DH=I/ ^& d A$ ~6 Y3 m" a6 _. `
: r9 |: ?) }9 r$ Q( b但是现在矩阵H HH中的指示向量h hh并不是标准正交基,所以需要对H HH做一定转换。令H = D − 1 2 F H=D^{-\frac{1}{2}}FH=D ; p' X: A" E- w% }− 5 t, r' i+ k* z6 v- t
2' M9 M) ^9 e$ X1 n0 X9 k
1/ B J9 [; ]/ C+ ]
8 |: t1 b3 W0 |5 O3 o+ I
7 H! y J4 v" T5 d+ l# a {
F,则H T L H = F T D − 1 2 L D − 1 2 F H^{T}LH=F^{T}D^{-\frac{1}{2}}LD^{-\frac{1}{2}}FH . s' H2 y: o. H8 w9 a+ F5 \+ I
T* L" N4 I: |( j) f
LH=F # n+ S, R, H# ]: ]/ m1 l8 C* i0 WT8 Q u/ F# \* ] ~; r1 C: ?8 L
D 3 R9 W7 z M5 y% L, n ]9 u4 y
− a/ B1 Z, g# i2 C) v. d
28 p+ {* O* C4 @
1 z) T$ b% a# V- }7 x8 H W4 P1 P
4 `4 ~9 S/ Z( D$ A$ u _/ x$ t5 _6 K- J! T; R4 n% o! \, E- {
LD ( M% u/ J& f1 z7 b1 s/ t− s' b0 d1 `6 C% x25 |* T3 b8 x" K1 ~
1 # O4 {5 f. l' a4 z ( i. Q) T+ [' ~4 w9 @' g; b6 H4 U4 B; g, S' Y6 k0 ^" |6 K3 @. S2 X
F、H T D H = F T F = I H^{T}DH=F^{T}F=IH $ r: R1 n( z/ J+ K- d! x& I Q
T& \% Y |) c% O9 U3 X
DH=F ; p4 W5 m i; p R6 K& [: @
T* i6 `: W5 Q- s! K! \# e' e3 y
F=I,于是优化目标变更为 - s: J, T K6 E; n/ \! O# p. \a r g m i n ⏟ F t r ( F T D − 1 2 L D − 1 2 F ) s . t . F T F = I \underbrace{argmin}_{F} tr(F^{T}D^{-\frac{1}{2}}LD^{-\frac{1}{2}}F) s.t.F^{T}F=I/ o' n; o# f2 Q4 I
F 0 M3 M% L9 ]; G. b# p* M% s" e6 Iargmin' L& N# N6 H$ X, M. Q9 j
; N& N6 V. b) R0 X1 l1 L$ m! \3 {, p! l; ~8 u% }5 K% b, l
4 K1 ?) F8 t! M- x
tr(F . u0 v0 z6 Z: z; ^) [T 7 B; J0 V& ^( t- E4 I7 [ D ! I; z G& v$ E6 e! d; G− 2 ~3 H- k- a# {* V2. ]5 s3 w, E) t) e. P
18 S, X% r- E& F2 h
8 }" X7 n2 w% U* G1 b) [( A1 m" W* j- _0 B
LD " n7 S9 I% i: q: a− 1 ?4 B2 V: Z# Y2 t* r2 ! d6 m' H6 z: a( g1$ H% m$ l8 M* ~' y1 {8 Z4 ?
7 f+ N4 V! I9 v V! ^+ i% F, l0 u5 m( n/ d' L
F)s.t.F + u8 M% B+ T0 T: R# W
T8 }2 `+ K# D, C2 ^" ^6 C% i
F=I 7 R% O! D3 ~; @3 C6 ^4 R, h! r5 d) B& P- c3 x4 ~$ I, w
现在,和比例割一样,通过找到D − 1 2 L D − 1 2 D^{-\frac{1}{2}}LD^{-\frac{1}{2}}D # \$ U! [3 p! n- t4 w− ; G4 d8 Y' y1 Q: N/ T2 - }$ i Z: e9 {% e- d- I0 ?( s1( q3 q6 {# b9 q( ?( V! [
+ @( q' p" F0 b+ Y# y- E4 p
|2 f" M! V, ~1 h/ R
LD 6 `/ o0 w% d, `7 f4 h
− 3 z @2 c1 U5 [$ P0 L2 ; G% X5 G# a- a) P$ N1" B3 _# e; W* g3 V
$ k! l, l/ p) l- \
, b4 i0 v1 m6 Q# D (就是之前的L LL)的最小的k kk个特征值,可以得到对应的k kk个特征向量,这k kk特征向量组成一个n nn×k kk维矩阵,也即F FF,最后对F FF进行传统聚类! ]# f9 \" l- w. \' w7 J
/ k2 ~$ e$ C& p, _2 R
一般来说,D − 1 2 L D − 1 2 D^{-\frac{1}{2}}LD^{-\frac{1}{2}}D ; M2 W/ M& z: b: f: a3 r% c* y
− ) F" O: Q" I; |4 Y6 A( ]9 g25 }) ?. X1 i: \# w$ P: K& m( J
1 . k: Y3 Z6 P4 U1 ]7 E! Z* B; T6 c ( S; h p1 ]( Z. f( m/ @( f, F ^% T4 o z6 k: A7 {: a LD 1 |9 {. l! w/ b3 b. X
− / U( ]; j' T: Q8 D. v( [: z
2 % Q2 q0 y0 K4 G1 ( E7 u% e/ n& o2 h 2 |1 @0 d7 m& X4 v8 `* a( a 6 j+ Y, Q# |) ?; }! J5 V 相当于对L LL做了一次标准化,也即L i j d i ∗ d j \frac{L_{ij}}{\sqrt{d_{i}*d_{j}}} 2 k% T9 C! A8 T8 G6 ]d 7 M3 ^; C+ e$ C, Mi 3 [4 w) S% d! R0 }! x8 y. [% |5 `: B; J0 \4 ^0 Y
∗d " Z" _& Q' @1 `: g, Z4 B
j4 i3 `' ~: E+ j9 c$ E
3 \. _- R) [* [9 [9 H( J5 W6 p6 {' n5 G6 e) g* C9 `! c
8 ?+ E2 [0 m) B$ t+ e% F/ k) ]
_/ S F+ f& c7 {
L * Z k7 _1 n0 W3 ^( N
ij - M4 m, Z7 Y( t2 E6 z$ D! Q3 Z! Y3 G: W0 v, ~
/ j% J# J, q% I0 {: D$ j: }' _! S" W: Y8 `! O
M4 U9 S2 D2 ]# V% s
二:谱聚类算法流程) ]* A7 w( [" z. X( Z
给定数据集D = { x 1 , x 2 , . . . , x n } D=\{x_{1}, x_{2}, ... , x_{n}\}D={x 7 W W: U' |$ v
1 7 f4 g6 Y8 r0 ~/ u# Y7 ~9 l' ~. x X$ r9 ]+ N
,x 1 w+ z# ?4 m1 U
2 " |7 Q7 ^- F$ _) W; D( C& Q# H. o, Z% W7 {
,...,x 1 W# G) l4 \5 s7 z" Vn( F8 f! u5 h1 E& |/ V
& u4 `8 v* Q; D/ @9 q
} - \' n$ l) d* Q2 U5 {' g% E+ O4 a 8 Y7 _) i9 s5 \: k2 g; }: l0 V( O根据输入的相似矩阵生成方式(一般为高斯核函数)构建相似矩阵S SS(AffinityMatrix) " {* d3 M8 f+ a3 G8 r4 ?根据相似矩阵S SS构建邻接矩阵W WW,再构建度矩阵D DD, a+ f, T$ }6 U3 o0 d3 P9 @1 [1 a
计算拉普拉斯矩阵L = D − W L=D-WL=D−W+ F/ H3 o; }/ L
得到标准化后的拉普拉斯矩阵D − 1 2 L D − 1 2 D^{-\frac{1}{2}}LD^{-\frac{1}{2}}D : F6 j! d& a5 |4 }5 p3 f& h− ; r2 A( q1 k! u2 + T8 H- ?( ]. Y( r1 # w+ b6 c. u1 J. l! e' E4 g: {% C% A3 r9 }0 Q