QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2295|回复: 0
打印 上一主题 下一主题

[其他资源] 【数据聚类】第八章第二节:谱聚类算法之切图聚类、算法流程及其实现

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2022-9-12 18:41 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    【数据聚类】第八章第二节:谱聚类算法之切图聚类、算法流程及其实现, k3 c; k$ `3 ~% J$ U! g" }

    4 X2 ^9 B6 V' e+ z( i* ^- W$ {8 x本文部分内容源自刘建平博客,在此基础上进行总结拓展
    , |; r, @* S8 k% B! t( q+ k) y( i0 t" v9 `& X/ c, V# Z
    原文链接
    # S, }5 n2 @6 R2 C% G文章目录
    & K+ ]/ A9 ]& b3 ]2 d. T: Q/ Y: G一:谱聚类与图划分
    : P( x0 W" Y1 Q7 k9 N. T6 p(1)比例割
    3 R' S; d# h; {& S8 L(2)规范割(常用)  w+ G6 |1 Y' }- }, p
    二:谱聚类算法流程2 i, C1 N; L+ D
    三:Python实现
    ' p6 w; V3 v4 _' D: _  Z四:谱聚类算法优缺点9 h5 X5 k" M% a5 H
    (1)优点
    ( T3 {* H/ p7 I: L" P# t) w(2)缺点6 m+ P& A% o( y' L/ b; u
    一:谱聚类与图划分; l- z  Y3 o9 ]. `& d  W) ]
    无向图切图:谱聚类算法根据数据点之间的相似度将数据点划分到不同簇中,因此将数据点映射到无向图之后,可以转化为图划分的问题。对于无向图G GG,切图的目标是将图G ( V , E ) G(V,E)G(V,E)切分成互相无连接k kk个子图,其中; y3 Q* Y) l  b# B
    % @, }  i- ^# }4 E5 y
    每个子图点的集合为{ A 1 , A 2 , . . . , A k } \{A_{1},A_{2},...,A_{k}\}{A $ f" E; h, G) P; p
    1
    3 E$ m; ]  ^/ L& b+ Q' \
    ; b7 T% G% Q. q% | ,A ! J: G: c5 {" R9 u4 h4 [0 a! o
    2: _2 A* y+ Y) @3 f3 h( E( A+ t

    : t. ^9 x- c0 e5 @: @" L ,...,A $ F* x7 b  R0 ]. A' a
    k$ T  f) a7 B5 ~6 a

    3 {" I- Y" q2 |; I( P },且满足A i ∩ A j = ∅ A_{i}\cap A_{j}=\emptyA # S9 j( ?2 J  Q% q, I* N
    i
    ' h- E2 K# S* w; R0 @( O" w* B( _# Q: O/ @; k  H+ p* c8 ?
    ∩A , E% |9 S8 u$ R. t
    j
    , C9 B/ B! O6 a2 v$ j# U& n0 h0 ~. T- u3 W
    =∅、A 1 ∪ A 2 ∪ . . . ∪ A k = V A_{1}\cup A_{2}\cup ... \cup A_{k}=VA
    6 f" n2 F/ m( v9 c1
    * `0 P' A0 c; ?6 Q; v+ s  z
    , P+ N/ z6 {* W ∪A
    & D+ P/ g9 R- A) Q2
    ) W& |( ~5 h# W& q" [
    / ^. I2 A% }. @4 j7 l ∪...∪A # m6 J& _  n2 s4 Z2 }
    k
    7 p$ O" N% k8 T' ]1 g+ C3 M( E( m4 ]7 T! `, h( [$ O3 s$ r" Q
    =V
    . R1 S7 P4 Q8 _+ z7 s- u/ H5 R对于任意两个子图点的集合A AA、B BB,我们定义A AA和B BB之间的切图权重为W ( A , B ) = ∑ i ∈ A , j ∈ B w i j W(A,B)=\sum\limits_{i\in A,j \in B} w_{ij}W(A,B)=
    5 I6 ]  ^9 V3 G, di∈A,j∈B
    " V0 K) d4 U* i- m: {4 G* p+ h. v% o; k! ~' l: B8 R) e% [( e1 j2 n

    . z1 a( e1 Q7 L% F w
    + {, K0 C, k- X  Lij2 ~. Z7 X2 c. r( t
    6 r( g( t. ^% i) R" o% D! X
    5 z4 L# I7 m# N
    对于k kk个子图点的集合{ A 1 , A 2 , . . . , A k } \{A_{1},A_{2},...,A_{k}\}{A
    0 T+ W  a9 o4 y: M6 F1+ i: e# C9 q& T7 P

    5 n" J* }# [# ~; m) p0 | ,A
      `' \3 C" u$ C2
    # T( ]3 f5 o( P; s" J  H
    , v7 v/ b, q5 s8 i4 a9 S" J* _( @ ,...,A * J, D: [! ]  r- P; @* x) g; K
    k
    6 c5 w2 `; V# F  n# E# F# o* h9 T' F0 B; u* R
    },定义切图c u t ( A 1 , A 2 , . . . , A k ) = 1 2 ∑ i = 1 k W ( A i , A ˉ i ) cut(A_{1},A_{2},...,A_{k})=\frac{1}{2}\sum\limits_{i=1}^{k}W(A_{i},\bar A_{i})cut(A 8 ^, J9 t  B- h$ A' x# n
    1
      p& x( @4 s6 y8 |5 L- s1 n& r$ r% Q3 r2 W8 U) b
    ,A
    ! B: e' C2 ?( I5 `2& O6 R# i3 ?4 h! a; U4 z
    ; J; y" a# c" ^, l
    ,...,A
    , C# C+ w  i; u' M) ~k
    8 c* a- o$ _# \! A6 _& K! ?# @+ o$ h# P9 x$ k5 s/ G
    )= . t! Z( S& a: [, r7 j8 W
    2
    : Y6 `6 b, P4 r, a1
    % F8 Z1 n9 S* z6 q2 R( W& R, l; C: y
    6 M. c+ }( Y! ]" e6 A' S, [
    i=1
    2 `7 p! |) g7 e- E
    ( g7 ^9 T: k* c* G9 u9 O4 K( V$ ck
    # d- k* C1 |! o9 k0 r
    2 y6 `! H0 A4 o  D! I+ Q: B- r W(A 6 j9 J4 b) Y, ^% ?* f. r
    i
    ) n+ e1 l% P* e: p6 P3 a# x0 r9 r" x/ K2 n. x( P) V
    ,
    & Y5 G" o6 g3 XA' j4 \5 M" S/ C0 I, d- s6 U
    ˉ% U# e& G) e0 `- B

    ' Q( k* G& m& yi/ ^4 c) G! S) R

    8 u* q, D+ `6 `- F' X4 H* k' m' X( Q ) (其中A ˉ i \bar A_{i}
      e6 \" y! l4 t' Z+ h/ IA
    . z# G, j+ r" w& Rˉ6 g" M, P! ?! U

    6 p" n2 ^; `" P! \% T4 x! Oi
    ) s7 \" o: K) q  l$ a6 d5 X* _! f' s+ e4 x0 r# `
    为A i A_{i}A " h. s% p) n# J9 V0 i8 {
    i
      {0 y* w* A& y( s- ~# K
      `1 P7 j) j! {  }. `- z) S& [ 的补集)5 H; ]& ?. q: w# F# T
    可以看出,c u t cutcut描述了子图之间的相似性,c u t cutcut越小那么子图的差异性就越大。但是c u t ( A 1 , A 2 , . . . , A k ) = 1 2 ∑ i = 1 k W ( A i , A ˉ i ) cut(A_{1},A_{2},...,A_{k})=\frac{1}{2}\sum\limits_{i=1}^{k}W(A_{i},\bar A_{i})cut(A 1 M8 F/ ?8 b1 d6 }, {4 ?+ B6 @- ]5 V- h
    1
    % g- f% l9 v: s5 [  L) I
    0 W4 d2 N7 ^7 `$ {3 y. n+ ] ,A
    % k8 n0 V3 K. G; z1 x3 w5 d. M25 }% ]5 o8 V) ]( }
    4 Q- W- ?( K1 E2 w6 Y
    ,...,A & B5 V! J1 y9 p
    k
    " x: B' l) F/ k4 D6 T, T+ O/ @( \2 I' b  u4 ^1 |* n
    )=
    " h3 h( y3 X  ^) E2; \+ [' o" m2 o5 q# {2 L* L
    13 D/ z3 q' Q! M6 ?& s' `' Y' S0 t. ?

    , J/ {3 Q/ h! ]0 b, M' T: ?; ^2 q% K3 v$ o5 g6 V+ W, m1 f: Q3 D
    i=1
    * P) T* ^2 H$ ^' ^0 a7 `; h- l
    . G0 \2 o2 {9 G( ?, l. Kk; M& r+ W" _1 _  }  f$ ?- k

    7 s& ?" d) @3 Y: o# X$ P W(A
    % G1 t; \  ~; L" oi% g- s1 o* H/ N1 K
    ; c: I* _. y* a1 E" v
    ,   w2 d3 X: I/ O' M5 k
    A- c- T) r# S$ `* N# ~+ j
    ˉ8 E* R2 h, X6 i6 o# p

    + q7 X' o' T4 f: T) @3 I) Ci
    " G# M$ r! Z" i4 Z; T& P
    8 Z& F2 z$ p9 }% }/ ? )在划分子图时并没有考虑每个子图中节点的个数。所以在某些情况下,最小化c u t ( A 1 , A 2 , . . . , A k ) cut(A_{1},A_{2},...,A_{k})cut(A
    4 j' ^& m- _% N7 ~% j- B/ i2 w1
    8 a3 g* L; ]! W$ S$ h+ Q" G# v% o- ~+ g
    ,A
    7 L8 t( D/ A3 h9 _7 |, l2
    0 j8 A# m$ w0 @
    # k0 n  e; [- g: K ,...,A 5 m3 L. Z3 m9 f, e
    k" K+ \2 P: y( p! n6 ^

    . u6 n9 ^; G5 @- A; x  t. b- m. P% W8 W )可能会把一个数据点或是很少数据点看做一个子图,导致子图划分结果不平衡. Q* m6 ^8 Z. f7 F+ [

    . i' ~- J" t6 C" x; H4 N2 h例如下图,选择一个权重最小的边缘的点,比如C CC和H HH之间进行c u t cutcut,这样可以最小化c u t ( A 1 , A 2 , . . . , A k ) cut(A_{1},A_{2},...,A_{k})cut(A
    0 o3 U/ p! H" r: \+ @/ e& p1
    % j$ U7 e: r9 \. n6 {' x: d& A0 R. d6 _$ \/ _0 e
    ,A 6 O9 c& i# Z( k( x% X! K: l0 ^2 _; d
    2
      X+ s  l; s4 U% B9 N1 M* a. U3 }$ l" M# c4 W( k8 `2 e
    ,...,A : K* r5 U: V# ^; k6 w+ z  p' ?0 w/ v$ ?
    k
    , Z& o! J: N7 z. P  C2 d* {
    3 l- f$ w7 B9 f, q )但是却不是最优的切图
    : ~- b. g: X+ ~+ `7 B3 J
    1 s2 T/ e! C3 O! W. \为了解决这个问题,会引入一些正则化方法。最常用的两种方法为比例割和规范割
    3 T# ?, Q- v3 m% I8 ~- h
    7 s; k6 p7 P, n: \6 x比例割:R a t i o c u t ( A 1 , A 2 , . . . , A k ) = 1 2 ∑ i = 1 k W ( A i , A ˉ i ) ∣ A i ∣ Ratiocut(A_{1},A_{2},...,A_{k})=\frac{1}{2}\sum\limits_{i=1}^{k}\frac{W(A_{i},\bar A_{i})}{|A_{i}|}Ratiocut(A
    " U1 ~3 s1 m* K5 ?2 z1+ }/ h7 Q  I8 N) h, v
    : F. w1 A# b- A7 T" }. @1 z
    ,A
    # t( v8 X# I! j. k3 H! v4 e+ d2- X2 F; P  t4 z; y
    7 N  Q; y) c" o  ^' S! I
    ,...,A
    % X; g) ^3 p3 f2 m9 h5 Fk
    8 H* V3 R  E2 r7 K" N9 ]& W9 D, x% f5 U! L; i  R
    )=
    6 X/ i9 v5 s  i2 a2 @2
    & q& H/ [0 V% R( M7 d1
    9 A% s, V3 @( L. [" f$ P
    , z  H0 R3 F2 C$ k
    . h! w8 y7 h: U2 hi=1
    3 ?5 a1 G8 f, M6 x1 v
    - _& i# P/ c4 v2 F2 Q2 Vk
    # ^/ [' Y) d2 ~- D3 c0 \7 Z
    ; i' I1 R9 T" ]8 x+ C& Y* L! {1 T
    . v0 F8 K" p& Q5 X6 m# S. L0 p∣A 8 E2 x& H+ q2 ]1 y( ^0 z2 P
    i
    0 G' P0 z, z  _$ {
    7 Q' S0 e! i; v$ L% h& u3 d! P- A' F/ T$ o  z( d! b) \
    W(A 8 y/ ?; [8 T4 }: s% @
    i+ a8 P: n9 ?1 b# l

    - g6 F' Q. m% t ,
    + F. z) }- W1 ?6 _. r7 F$ s, gA
    & H3 f$ N9 R& x0 _! nˉ
    + T1 m( C  W  r4 \6 A& x6 J6 Q. F7 Z4 s8 I
    i
    8 o  J- X4 i$ ?0 y- J+ G6 j0 m) P
    8 L3 J8 `  K+ @ )
    $ z; e2 O% o! Q* ?% `. d1 A& E. y
    8 E; ^- y9 B9 E# b$ a9 J9 T3 H8 v; i4 Y0 G0 z: N
    规范割:N C u t ( A 1 , A 2 , . . . , A k ) = 1 2 ∑ i = 1 k W ( A i , A ˉ i ) v o l ( A i ) NCut(A_{1},A_{2},...,A_{k})=\frac{1}{2}\sum\limits_{i=1}^{k}\frac{W(A_{i},\bar A_{i})}{vol(A _{i})}NCut(A / e. G! U3 ?* f+ O* t  B! \+ F4 [
    1
    & [5 B% N; @2 N3 r: V  Y7 N  I) n( e) w, C7 O- J2 l7 Q0 s4 Y
    ,A : v4 C9 q4 f. P" M4 G% E
    2
      o( y5 A' ?' z% R, E. Q  H) y& c' k) |( ~$ v* E7 Y. v
    ,...,A : _; @$ u% b  j9 F+ v* a9 ^
    k
    & I2 S  @) v- n0 @4 @; _! u5 T; R( c6 S  q8 w
    )= ) B; ^, H7 p, T/ y! H
    2
    " C2 k" ]- {) M; Z5 J1$ l4 C9 j" x  z( K+ w

    ( a8 F0 E' |* D+ N5 q8 `  l
    ) M2 N- c/ e. U$ ?5 ei=1: k8 R' Z5 g- ^' o/ V
    ( A2 [# Z" r0 |
    k$ p+ u" F0 s) ^0 P( J! \6 T
    $ Q# p  r* Z7 {$ K9 a/ N% v

    ) j! n$ V3 r6 gvol(A
    & g. k' {6 F3 K/ Mi3 b0 E+ ^, C5 `5 k

    8 {* b( d: Q/ I1 w )# V1 r3 }" g9 d, t0 |8 W
    W(A
    0 i, s, x7 H' m" R4 s5 }$ O' m. wi
    0 E' Y8 I7 ], G) A. x7 W. v; v
    3 J+ {0 @, i4 } ,
      m6 X: k- {2 k: }5 kA+ t# y/ ~/ d" b8 _
    ˉ+ ?- A6 A1 L" w8 L
    1 h0 U3 I7 I0 t4 P( X, r
    i
    5 ~" C. S, L8 O" y) J* Y
    ' I6 i- j* P5 w2 ^+ x) X; s )
    . O' i$ i$ {1 }* v' X
    ; J/ l4 h0 R0 f) j- j0 [0 e
    # O& ?0 m- e. K" e3 C* Y! I0 i9 S(1)比例割
    * t' d) T. T6 H8 g5 }引入指示向量(点击可查看指示向量定义)h j ∈ { h 1 , h 2 , . . . , h k } h_{j}\in\{h_{1},h_{2},...,h_{k}\}h + h% X( t- c5 X; G
    j
    % A. N0 r9 x: ~" p0 u4 L+ i) d( r9 g! m5 c
    ∈{h
    ' v4 L" V" N7 p8 ?9 }1
    5 M. U% Z! K8 y) ?
    : H2 n$ f5 |; z  F2 X% C ,h 4 ?7 p/ |4 P% J) x
    2
    7 ]( e# [) G2 r" x/ F: b5 u; h# B2 n  R& _
    ,...,h
    + d1 t, t8 r% P3 K% Y9 nk
    ; t9 m4 D9 }3 f% c' J' o8 N' ^; s; a9 y, A2 b
    },j = 1 , 2 , . . . , k j=1,2,...,kj=1,2,...,k。对于任意一个向量h j h_{j}h
    4 W$ Q; I/ T$ z5 mj! _7 r: P; h( m, p

    + D  p- ]" a% s. ^$ C( c" O" p5 V ,它是一个n nn维向量(n nn表示样本数),定义h i j h_{ij}h
      z- B  Q8 R- G* ^9 J# d2 g* Sij% |2 U/ [* P% }( M$ T. |

    ; g+ T  ]. Y5 h( l3 e# f 如下3 S- p" {; [- q% C: d9 |- I# l

    8 x6 E- i: Y, Y+ |1 s6 V; B' Bh i j = { 0 , v i ∉ A j ∣ A j ∣ , v i ∈ A j h_{ij}=- N! o" {6 H, e, K$ _9 x0 ~# r
    {0,vi∉Aj|Aj|−−−√,vi∈Aj& K4 x0 H( A4 s" S7 s3 K! p7 B
    {0,vi∉Aj|Aj|,vi∈Aj
    8 Q% L' R8 Y  I$ J% e  o, Zh # [& `. i# I( u
    ij, W- W4 i1 G. @. A  \5 ]

    . u3 r4 P. l- U8 R, G' o5 S9 m0 k ={ + a/ T' \+ M; W
    0,v
    * v' B" y, U# i) h* a6 fi% C2 {5 |  S3 [6 g: {
    - D: m" d' _! `( l/ Y# A
    ) t6 w6 \0 ~. i8 i/ E, A5 Q& z; S
    /) B8 \0 D; L1 N6 n+ }% H4 V- w
    A ) R+ Z9 n6 Q; N8 @* J( y
    j
    8 f! J7 J& U$ U4 k( i, Q6 ~
    6 k5 {3 e5 g) r- ]* ]0 q+ V% [& A2 ^' s& t) x% o8 P7 V
    ∣A
    7 U0 T5 u1 J7 t5 V6 \1 y7 N2 ij
    ) W4 r4 h+ ^: m% ^, n9 ~6 l# N. ^, k  w- v+ V" S$ l9 z9 |

    / J1 ^( p" }7 S: P# S2 c* Q$ [' o8 ]  @9 s& @& }/ ~. c2 o0 R4 e
    ,v 5 V' l9 W! [; @& ~2 u9 M
    i
    # n8 s. U: j0 a, K, w0 u. q0 I+ {9 H$ a+ C
    ∈A
    0 \. P" d2 d" _j- E  T. f3 F& u  K* x: ~
    + ]* g4 p: n" D% w' c

    # d1 y+ H. _, l" g& ~
    * k9 v* ~2 t( H% Q# x, _2 d% O  X5 P' v1 `" H+ q
    $ C+ E8 Z9 f/ B- U! Y; {6 ?; U9 ]
    于是,对于h i T L h i h_{i}^{T}Lh_{i}h
      x5 O: Y7 x7 A, S7 `0 c% B: ei
      ^- q2 H7 d& b0 @; P" L  A5 W8 gT+ @7 M. }" j8 c' l& \0 k: z
    ' j7 u0 D4 T" P: K" m2 t1 b
    Lh 7 K: B$ v3 S/ C# U
    i
    % Q. d# v1 k9 X7 Q3 n  @' m4 I/ V# y5 X) j( C- L4 b5 X0 v
    ,根据拉普拉斯矩阵性质可知0 ^$ \1 N& u, e5 k& Z

    5 }/ s  p7 W! K" F对于任意向量f = ( f 1 , . . . , f n ) T ∈ R n f=(f_{1},...,f_{n})^{T} \in R^{n}f=(f
    # O# j5 F) d9 a0 _3 K; r18 m. d1 P0 j/ _/ B/ j- Q, N$ v! V8 d
    . q) j; ~$ n8 M* U3 G
    ,...,f
    3 l( `, {, k. On
    4 Q- X2 h0 @! c- p9 p" F5 [4 m) r) P, M1 p7 H
    )
    % r9 f  n7 U8 [T
    ! H1 l, h$ _4 V2 H ∈R 0 X. N7 g8 i# Z9 ^
    n0 r, J; Q& v, z7 {$ B; p: N
    ,有f T L f = 1 2 ∑ i , j = 1 n w i j ( f i − f j ) 2 f^{T}Lf=\frac{1}{2}\sum\limits_{i,j=1}^{n}w_{ij}(f_{i}-f_{j})^{2}f
    3 f4 I/ \2 c2 w3 o, |/ q2 |T
    9 v+ B, b6 P& I, C Lf= % U) W9 k  g! C4 {' ^4 b/ m
    2
    : T5 M5 D* v5 M1 U/ C( ^1
    8 @4 [! X) v' ?; P8 Y: }6 ]3 f( w0 ~$ V: X* `. v

    : f) S: k( c% s3 yi,j=1
    5 C: V% [$ g& N, i# |0 A3 U( c1 o1 D% T+ V/ D; P* }1 K: Y( M# ~
    n
    4 A) ]6 s0 n9 g5 {. c7 X, R3 D
    ( E8 c0 j( K* }! h$ d w
    & u& V2 l* P' Z5 |ij3 U- T* J9 a0 @( c" c  u4 j

    7 Q1 @( ^8 ?; }4 l0 O (f . P( x% D: x* r
    i
    % n4 {% S" f2 G; O& m, K$ g5 j8 Q1 S2 i# R6 _2 p6 ]$ C  e( U
    −f
    0 r* f- b9 Q5 T# I; V( C! J$ jj
    % f5 b6 z# e  W3 ^" s. o8 N! c# _1 k6 W3 |" f
    )
    " x5 R/ @2 @0 s) I- e2( n8 O" h) K9 D2 l3 M2 ?
    0 b4 }# A: F. W5 N2 O$ D
    h i T L h i = 1 2 ∑ m = 1 ∑ n = 1 w m n ( h i m − h i n ) 2 = c u t ( A i , A ˉ i ) ∣ A i ∣ h_{i}^{T}Lh_{i}=\frac{1}{2}\sum\limits_{m=1}\sum\limits_{n=1}w_{mn}(h_{im}-h_{in})^{2}=\frac{cut(A_{i},\bar A_{i})}{|A_{i}|}8 J3 r6 M! H) y- z
    h
    1 A; Z/ W- f5 C( x8 U! {- b/ L1 li
    1 d* y5 i! r) m+ J9 T( lT
    4 O+ X' Y7 d3 k8 |& f4 v1 z. _2 n" T
    5 D3 m+ M6 @* b$ f# q Lh $ Z4 i7 b5 ~! z+ D2 q9 x
    i7 e& W4 @) w  R# d2 F/ A2 W

    $ Z4 @6 B4 v: Y/ z =
    0 v) J, g/ R+ F2
    + J0 R% q, x) `9 {9 m4 ?, d  y1% @, x1 x$ E* {8 `& v+ b
    2 g3 ^2 t7 l, w' ?; k

    " j6 z) _. s* e' ~m=1
    * |( O4 c3 ~" `. H; C6 X2 Q" g2 I1 [9 V( ^( m+ L& X
      x* E# S) r0 ^; f2 N& E( K
    ! J7 T/ v$ f0 L* N
    n=1) |: c# ^+ w( |# m9 S

    : d7 ]. N* Z9 t
    # A4 g2 @( c5 a7 O5 _ w
    % `; \1 A5 D( ^( E+ ]mn1 O0 B1 R# H# h/ Z0 g! a

    / D7 C  g: ]6 V5 c- R (h
    - S5 Y; ?4 }# ?6 y9 N! |" Tim3 z: u( j0 M( F2 h# F8 y

    ' C! V6 e$ U8 ~# _6 r# u# L −h
    6 x/ W7 ]# F- i# Jin
    & h, x' D2 C3 v7 Z! v: M
    3 }+ e! v0 x) ?. T+ x4 L )
    * F" u' J! Y/ c8 i* k- T$ Y2
    . N. @! T, h% Q# R0 G =
    . Q) V! K, ?5 X3 w4 p/ n∣A
    ( _3 o' O( `& r. ?$ J& ^i4 J$ X3 t# S  A% v3 p& O
    4 ^0 l- @& H% }4 C3 \8 f5 }4 F8 Z
    - y/ m2 L9 _9 ?- t) B6 k3 ^
    cut(A
    5 w( R0 R3 A2 P& fi" U: u2 Z' w& \3 j
    " d- g- R% `- s
    ,
    1 j# r- N5 M! M  N6 \/ w8 Q7 y0 |A
    " D0 C' Y2 ^6 cˉ
    & ]% I# p+ f/ z! v  y$ j( D- S+ B, \$ `, m
    i' u1 o7 |- q: O& Y6 \
    . X( U7 z, Q6 z
    )
      e& U# e/ T2 T, M( Z: Z! Y. _# t7 B0 e$ b+ a
    9 w) P2 ]8 B6 ~, [3 z& R% @, H( y
    0 Q5 `; X8 J2 s' C5 @: v! c4 d' B5 d# o
    严格证明过程请看刘建平博客:链接" e# T. P- @  v, s
    可以看到,对于某一个子图i ii,R a t i o n C u t RationCutRationCut就对应于h i T L h i h_{i}^{T}Lh_{i}h - t! W0 V% q1 A7 O+ ~& W: b+ L2 A
    i
    2 ?, u# U% S: Y( U) kT: x4 u! Y' @1 E' v: q# z2 W
    * w& J/ N$ E; R: a
    Lh
    $ k) t6 S% K! Q% n& e4 Li
    # v4 P- c" O- K# f" X
    & Z! [# T0 P+ K/ @ ,那么对于k kk个子图9 l5 p6 r. c3 V+ w7 E
    + O9 e! A& H$ h- _# p2 I
    R a t i o C u t ( A 1 , A 2 , . . . , A k ) = ∑ i = 1 k h i T L h i = ∑ i = 1 k ( H T L H ) i i = t r ( H T L H ) RatioCut(A_{1},A_{2},...,A_{k})=\sum\limits_{i=1}^{k}h_{i}^{T}Lh_{i}=\sum\limits_{i=1}^{k}(H^{T}LH)_{ii}=tr(H^{T}LH)/ N. O# Z, v: B& e  R
    RatioCut(A
    " }3 Y' |, I' m; P. A8 G* i3 D0 z1
    5 e) ^0 \- ]7 ~; Z( @, h- I0 s
    2 L4 e  u1 f* A! G  ~ ,A - e; A2 I$ Y; s9 g  \
    2
    ( u5 q: [/ e% ^( |# G2 z8 X8 v4 p& L! N- J! s9 R! ?1 n
    ,...,A # ~" F3 z* g$ Q5 v! V
    k
    ( E6 d' j0 o3 p( H* u; o' r' J7 {: I
    )= 2 ~8 A; v5 Q3 O3 k! @; ^
    i=1- R2 o2 ^& T% H; M, V6 `9 p
    ' n! J8 m6 U0 `
    k1 c* `' L7 S8 A" T/ L2 D! O; s

    3 I! j! j9 \: P* G h + j. D1 Y- d4 B2 n; c$ @1 T6 t
    i* H4 |- B2 r6 e+ W( ~4 U
    T
    & V$ S3 N3 {" h8 y8 i6 W# [9 K7 \9 d6 K
    Lh
    9 E* e6 [4 V- `" [4 D4 y2 Pi- m+ q* p9 {% w/ M

    5 c  c* l. }0 ?7 i4 O6 _ =
      O) P0 n+ v2 ~% S3 ]9 Q. s+ [) U/ Ni=18 f; J0 q0 L0 D. p' u
    : k. v, W1 h6 W+ \: b$ E
    k
    3 D$ Y2 P7 g! O5 b4 u" b) i/ f& n  K& V
    (H
    2 ^" {' {; w: p1 W) rT4 P; I# G& S0 X0 Q6 T* G# z
    LH) 6 S: U: N6 `0 G" X: p% {- b0 L
    ii
    , D" b  H2 y( O9 J5 k: k
    ' {. {  c4 i$ p* K =tr(H
    : o! R" a7 s$ CT
    9 E# K+ X( w& ` LH)
    9 T' t! ~! V) F: e! M4 C) |  Q1 c$ a: x$ {3 m0 O
    因此,R a t i o n C u t RationCutRationCut切图本质就是最小化t r ( H T L H ) tr(H^{T}LH)tr(H   O& y+ w( n5 n0 U# r4 P* b  v
    T, m0 @+ x. n  z: Q' i
    LH)。又因为H T H = I H^{T}H=IH 6 n# E8 Q) w1 p* l% Z  A( h
    T
    7 }; v) q1 @0 a9 }; N+ P H=I(单位矩阵),则切图优化目标为
    6 u. x' [4 H# p( `0 y7 d6 Q1 H. w  F) t
    a r g m i n ⏟ H t r ( H T L H ) s . t . H T H = I \underbrace{argmin}_{H} tr(H^{T}LH) s.t.H^{T}H=I
    ; x  `: U% K( IH
    ' f7 P0 p3 J4 e, F4 n) ~# s  nargmin- b8 R1 r) S; }3 V$ q) D

    * g0 {; m# W0 R+ |- Z; T0 I7 ^0 V# ^5 Q7 d
    ( {( D1 c8 }7 F- T
    tr(H
    ! j+ {/ N2 n- w1 U2 V; sT
    8 b( _" j' y) x$ ? LH)s.t.H " Z5 a' d& J9 N  o; t% b2 q1 [
    T$ n0 l7 Z& Z9 x! j+ |- a! m* w
    H=I  k+ S: @2 ^4 }+ F  p* l
    : O8 d( s5 j: A+ o6 i* P
    对于优化目标t r ( H t L H ) tr(H^{t}LH)tr(H
    5 o  m5 q* w3 f3 j! w. Zt
    & ]' @* q: i  y  Z. v0 I. l1 V LH)中的每一个优化子目标h i T L h i h_{i}^{T}Lh_{i}h
    9 A- C* z8 Q7 y2 \1 Q. R& O# q! P2 ti6 ~8 R6 q3 a1 A+ S7 S0 U
    T( f( x0 Z' g' {. i- o

    ; ^7 z2 x/ B9 e Lh * Q+ ]0 R& l' }1 O
    i
    7 ]  L6 i9 P4 W! }- A" w8 |, O( ?  \- L( p0 W0 ~# k
    ,其中的h hh是单位正交基,L LL为对称矩阵,所以此时h i T L h i h_{i}^{T}Lh_{i}h
      o# D9 }1 N7 ~' Bi. }8 x3 Y9 o# b7 ^- L
    T+ c7 K3 i1 G6 S2 d3 X
    6 B" C, g- M+ l! t& `* g
    Lh , ^  b* p5 U" G% z" \/ h# P# b( d
    i
    3 p1 `8 b9 e5 @2 S2 J$ d$ P5 Y
    0 }$ ^4 f$ x1 B( F  u 的最大值即为L LL的最大特征值、最小值即为L LL的最小特征值。而在谱聚类中,我们的目标就是要找到目标的最小特征值,得到对应特征值向量,此时切图效果最佳。所以对于h i T L h i h_{i}^{T}Lh_{i}h
    1 p' y7 j) K# w  ki: |" K" c0 R4 t' U( i
    T
    * h# y4 N; i! l0 i
    4 w" ]" M' J& ~3 I7 e Lh
    ! [: F+ }6 [1 k9 }3 u9 S) Qi
    3 D5 N' z4 e$ z* {- s
    1 z. ~1 {7 r8 r- [2 M ,目标就是找到L LL的最小特征值,而对于t r ( H t L H ) = ∑ i = 1 k h i T L h i tr(H^{t}LH)=\sum\limits_{i=1}^{k}h_{i}^{T}Lh_{i}tr(H
    * W+ P5 x) y5 |# v2 E3 C/ z9 vt
    4 M) r7 A" N% Q$ { LH)= 3 E( p) Z/ \+ P8 ^, ]8 |2 v
    i=1/ a( ~, ^, d1 H0 q& v

    9 L; V/ z/ b, R- dk
    & x  E- W! X. c/ S8 t# u, B9 ~
    3 Z, K3 ]+ d, Y6 B' I  ? h ; k: d9 P( j! ^% h6 B8 E
    i
    / u, o" Z, {9 [( g" W& GT
    - n2 h' M; T# Q6 `$ F  b
    " l- M3 `$ h5 r: h9 R Lh ( q. Y' P; w& `
    i
    3 r1 s/ z' I* a& R& f" o; H7 G  r: V2 k& e- H) [- I- u- H5 a
    ,则目标就是要找到k kk个最小的特征值+ @; \( N2 E/ C; N

    , C; ?  p0 M2 e0 H+ \" I) l! o' \因此,通过找到L LL的最小的k kk个特征值,可以得到对应的k kk个特征向量,这k kk特特征向量组成一个n nn×k kk维矩阵,也即H HH。一般需要对矩阵H HH按行做标准化,如下7 D$ b7 v0 b7 H

    6 Q: L# h& e' Y! X一般来说,k kk远小于n nn,也就说进行了降维8 u" [1 J" L' Z9 {+ o
    h i j ∗ = h i j ( ∑ t = 1 k h i t 2 ) 1 2 h_{ij}^{*}=\frac{h_{ij}}{(\sum\limits_{t=1}^{k}h_{it}^2)^{\frac{1}{2}}}
    ' m: }. r7 _) ]0 ]& oh
    # u, n5 S6 Q% m. L$ uij# H! j' l# N4 o, |4 i' J

    : y0 W5 R6 c& d
    ! f/ }* N, K0 f+ d = - R8 j) v, Q% g4 b
    ( , D+ y4 N' T1 c0 R+ w: I0 c
    t=1! t) E) a2 T/ F+ F6 d
    9 [5 l% o% J; a, C
    k
    : W) ^  {3 ?8 g# l2 C
    - M2 u* d5 S4 A* G h ! N8 w6 F2 R+ ]  Z
    it
    6 C8 F3 P/ @  v4 E- L" v2
    5 O- |+ L1 v( v3 N" d& k5 Q7 p
    1 q+ _- O! a& _: N/ A6 n0 i" `# N ) . I3 }, x. [2 [. b; b# e
    2
    + P/ Y4 d( w' @% [3 K# e8 j/ x1
    , J, n' `- R. d  R, K
    - ~" y7 O" u7 ~! y6 e( |( q7 X$ G, G

    " h: d0 y. Z$ o% j4 Uh ; N! a9 S- ~0 W+ k( c/ k
    ij
    * A% W, c+ ^+ ^* |+ f9 c' ]. m9 p$ `  @' g( h6 ?; L2 K
    0 Q; a4 R6 K( d, J0 I; i- q/ H4 u
    8 ~/ c. u( b3 Z% Q& Q
    % ^* X9 u" Y5 q0 g+ k, A

    + ]( r8 O+ E& X这里需要注意,降维后导致得到的指示向量h hh对应的H HH现在并不能完全指示各样本的归属,因此一般在得到n × k n×kn×k维的矩阵H HH后还需要对每一行进行一次传统的聚类,比如使用K-Means聚类2 Y% b4 L+ W. ^% \  R
    1 d, {& Q2 B6 z5 z2 `# W
    (2)规范割(常用)' ~; _5 S- e  w. `
    规范割和比例割类似,只是把比例割的分母∣ A i ∣ |A_{i}|∣A / u1 ]# Q, L# Q' A4 O7 y( H; Z, |* D/ c
    i. a" I. b$ U  c4 v) `

    $ m1 ^: q# ]- T, q ∣换成了v o l ( A i ) vol(A_{i})vol(A , `* ^0 B- n$ t6 O0 F" J9 c
    i+ c, p2 j. q, B
      T' @/ D" \7 A6 t' m
    ),定义指示向量h i j h_{ij}h
    1 i& G* y7 U8 D0 g/ a) I9 \ij3 ]- ?7 r6 w7 Z! T2 Z
    + q6 Y( |, g# O" [
    如下
    $ A+ D9 j$ t- I$ ~
    4 \: T% {, ?! J: q  t" m& a) M- Dh i j = { 0 , v i ∉ A j v o l ( A i ) , v i ∈ A j h_{ij}=; B7 @: G. c7 V2 F6 x. Q! Z
    {0,vi∉Ajvol(Ai)−−−−−−√,vi∈Aj% Q+ G- M1 ^0 E; m0 }! Y! n) h9 v* C
    {0,vi∉Ajvol(Ai),vi∈Aj9 l- u+ |4 _0 I* h* V5 t" R, O
    h
    ( S! ?$ g& a: n3 W; z6 }' Gij) f4 f8 M- d, X% }# N

    ; G. [( r% `' C# R* P' Z$ t ={
    ( c5 [# P" p, ?$ x6 C0,v
      z) [" G4 _/ j3 O' d: ri
    3 ]7 x3 m, L( g3 w0 H/ w9 D
    & F  |# ]& L7 t* s: z9 B1 ~6 M4 ^1 h7 N! Z9 Y: ], S
    /
    4 j2 }8 B# x9 }" rA ! a5 _# Q' F& {% ?0 ~9 v. y
    j
    $ B7 j: W5 \, Q, \- b. H" ~1 \3 b! I& f) ^
    % X/ p1 S3 C. C/ t- i
    vol(A . F7 s6 @& v9 F: A6 N( [
    i2 s0 I9 @5 g( p

    0 j% P3 {3 M' P1 d, g6 ` )  C3 A( i, k, M! D$ S
    9 A1 R% h) s/ W; @
    ,v - s0 ]7 Q. h( \
    i; r& ]7 S, h$ i
      J7 l  ^$ Y# x& J) R! D/ \& q0 X
    ∈A % m: E9 q9 j: R5 i8 e/ {
    j3 ]& K: c/ a7 C; }$ f6 m5 Q
    6 R" |% u: j! P5 w0 a
    8 B: r% M% u- N. G
    5 l7 J$ U0 O7 l$ T/ |
    0 u6 y- Z  c8 d

    ! k4 k3 @" Z% P$ G! c  V于是,对于h i T L h i h_{i}^{T}Lh_{i}h
    . V! S6 R+ S$ G  m, X6 e& _i* D) s. {  j, V4 O3 S! O7 x
    T
    ! f3 B" _" d/ r2 l' z0 c1 z9 o6 A
    0 Y0 `& M, e/ }+ g  u8 I- b Lh 2 M6 E; r* _/ w% r* w/ L! l
    i
    4 x- y& }6 I" Y/ O, Q2 S/ t: _5 I0 R% H% {9 S
    ,根据拉普拉斯矩阵性质可知6 {  c# w; z8 }6 }+ ]6 x- \
    $ E' C. @8 ]9 N0 w
    对于任意向量f = ( f 1 , . . . , f n ) T ∈ R n f=(f_{1},...,f_{n})^{T} \in R^{n}f=(f
    6 u- v% [4 i! U2 I11 H4 b  [1 M9 V) a$ X9 q# n
    2 w3 L1 r  y6 d0 j" w" ?6 a
    ,...,f + R' O6 M( v" q. C, v! e
    n
    : T& `9 v$ q/ A& D/ _5 {* S
    * I, p1 D% n5 b  a; E& { ) $ D+ j6 }* e9 h  o
    T* K, [. X* S, `" ~* @* S
    ∈R ' t6 T3 [! u8 W9 s
    n
    5 y4 t7 V5 j: N# z8 O ,有f T L f = 1 2 ∑ i , j = 1 n w i j ( f i − f j ) 2 f^{T}Lf=\frac{1}{2}\sum\limits_{i,j=1}^{n}w_{ij}(f_{i}-f_{j})^{2}f
    4 U- V$ B6 Y; P; a. m( p: B2 oT
    : q7 l- Q, G$ s4 T4 s Lf=
    ( I- j' |. w8 F. S! B20 D2 Y* E  Z0 v9 g
    16 a7 {0 K4 C& k9 [! ]- U

    & ^, Z) l0 h5 e5 Q! e  r3 q! x
    ; f: h6 P2 B+ D4 Y+ ci,j=1/ L" W- J( U+ l, S9 h9 J

    , c2 t* ~3 a5 g" R7 T8 fn
    4 }; s/ |9 J1 a; }# W. u/ T( J8 x/ r4 d' `9 m/ J# M7 H
    w
    / L+ n3 V7 i: c% ]7 Qij
    ; X2 k' D; R( k$ z0 j9 a* n- U5 M$ n9 z$ [# S0 ^' x
    (f
    + L. T. V- l$ K' I  M- M) `i
    : M+ n; w/ O# l( T4 y
    $ u  f, P- p1 }, J! o" p. t −f
    . s0 B% p, }. G. Lj
    5 W6 N0 ]; ~4 f! J, ?5 y6 r( @1 }6 U7 E4 @/ n, s) b
    )
    9 d, |1 K# f; l5 f- ~- V3 A2
    : b# T5 e# H3 o# f1 }; k9 I  _& _9 @) v- h9 q4 g+ [# L
    h i T L h i = 1 2 ∑ m = 1 ∑ n = 1 w m n ( h i m − h i n ) 2 = c u t ( A i , A ˉ i ) v o l ( A i ) h_{i}^{T}Lh_{i}=\frac{1}{2}\sum\limits_{m=1}\sum\limits_{n=1}w_{mn}(h_{im}-h_{in})^{2}=\frac{cut(A_{i},\bar A_{i})}{vol(A_{i})}6 s' l0 i4 ?! f* e7 R% [) I
    h ' q3 l+ b0 Y. i, }0 i8 Q- t: _1 i
    i
    . H. |5 [6 Y* e7 tT
    / {% Q- k% r  _4 g4 {& h
    5 ~9 ?# ~8 m, K Lh ) F7 w1 p& ^* B: z; z, G
    i5 w9 s) d7 n; D$ r7 Q: [: y3 G

    ( G$ y: f; `( ]* |) S# J =
    9 D9 Y" Y0 l/ T2 X1 v2
    : C8 h* m1 o9 U# `- T1, C; P0 Z# K8 c5 P' ?0 ^+ v+ @

    4 ^* @& y. h/ ^( R8 U/ `& @) @1 M. U
    : t& q! @  e+ v( M5 bm=19 t* i$ T# U: t# a1 U% O; H3 U
    $ u% Q6 b: W0 D1 n- w

    . j2 E/ y  d! c: F# _9 c' e
    # P: @) V* R! w# k/ Hn=1
    6 m, i+ U2 j! d" X
    / Z& v& F; S, K1 N# D& u0 w1 o" {
    " R6 F8 v5 u6 @& b( R! E w
    ; b; c# i( e7 A; L9 N* ~4 |% ?mn& H( H1 l( n  E/ U$ V3 L, K# J
    7 W. l+ |! x: q
    (h
    2 H& \$ W7 R- q, o5 r) Y: {im
    * u& n8 |( q0 O/ u4 J7 o" d  G3 o+ g" A6 C* w( X, L; V' j
    −h 1 p5 |  s6 Y+ r1 v8 B& |
    in
    ! h, [) S" M* ^( w* z, n
    / v! [2 d- M" {! Q ) ( F4 b# `# i# M3 Y: k6 N  ?- w- p
    2% U& J, F8 t3 S: b  ~
    =
    ( Z2 {$ A# ~% s7 h5 J# Kvol(A ' ]6 s0 M( |. d# I0 i$ k  a
    i3 A/ m; A" Q& Z: N# {0 x
    ( u/ t# h" M% b4 N1 x8 r
    )$ e( B6 V: _( e3 [7 b5 C
    cut(A + M2 }2 L% G: ^) R! _2 B3 }: L
    i9 ]1 n: K$ x9 z4 L8 b' u' \( [

      E0 t3 r% H6 {, q; p. ?" e9 Q4 }/ k , + n6 F0 W) Y! R/ v
    A
    # U# u& u9 _: }' D1 b- x& s/ bˉ
    & N  X7 f( n# t* v; E0 K5 G# p# A1 f
    i! l3 p  C2 _3 l

    7 K1 B6 T: J$ D4 Y4 W6 m: q* _ )
    + k5 ^( [; C9 z1 K- w: B
    3 g7 h0 [6 s- T# I6 r$ d$ O4 l
    2 X- v- R3 M& K% V) c
    # w+ J4 l- R/ ]9 a6 R5 x) }; o' J严格证明过程请看刘建平博客:链接
    3 y3 \" ~0 ?2 J' K5 `7 G$ t可以看到,对于某一个子图i ii,R a t i o n C u t RationCutRationCut就对应于h i T L h i h_{i}^{T}Lh_{i}h
    ' A) J) C, m2 z7 o# _i( |/ F5 |9 Y$ T# k" c& p, T" ]
    T
    1 E/ z; E8 R5 s" @7 ~: ]+ M2 t" T% X$ S
    Lh
    ' j) y3 R6 k; L+ A/ A; Yi# g0 d* ~5 C) I( u! Y/ ]: e$ b; @; M

    ) d* l0 [; a' P3 {6 w; Y ,那么对于k kk个子图; S3 M2 [: C6 D5 T

    ; f, O* ?$ C( ?) W0 c& P1 p# U+ @N C u t ( A 1 , A 2 , . . . , A k ) = ∑ i = 1 k h i T L h i = ∑ i = 1 k ( H T L H ) i i = t r ( H T L H ) NCut(A_{1},A_{2},...,A_{k})=\sum\limits_{i=1}^{k}h_{i}^{T}Lh_{i}=\sum\limits_{i=1}^{k}(H^{T}LH)_{ii}=tr(H^{T}LH): r7 X, G( k+ u* \
    NCut(A * s# R5 f+ [6 K& `/ q! M% J: S- |2 Q
    1* N, ?* M! H2 p/ x6 K3 f( E
    5 ]. [6 w# k/ w; p% J
    ,A
    9 Q% A2 \# n& L8 y9 B( L25 K$ N" f0 i& r( f4 m
    ! D' x8 t- z$ X6 g" ?$ g
    ,...,A 0 ~/ T: T6 {) A% g/ `1 z
    k/ |2 X' |  o1 ^0 g8 Z
    / f. Y$ ?4 j; i1 `% W
    )= . {( t& P4 M7 S7 d: S( f; M
    i=18 e) A& f# i9 _3 z1 M/ l+ V5 Z
    % O! `. Y; L1 G2 y: H) G# o
    k
    ' F& g% S9 @" C( F
    ) K# y2 p( k0 ] h ) M1 Q- y7 x4 |$ @$ ?- o: y
    i
    * \' }8 m+ z+ q# J$ R, JT
    ! M0 e) L  ^5 T8 i- y
    2 E) M6 ^: Y4 i. P Lh * H8 K1 A* S" V0 r' G+ v2 ]
    i9 F! A% d  i' l# S

    6 h0 s9 n6 |( U& _. p = * G1 e- g$ p5 ]8 U' w! `* Q4 b/ {1 d
    i=1
    ( _! y: m7 _: C5 ^7 h& T& K3 d! ^/ R7 @9 @* k, \
    k
    9 u! J- S! C0 D+ a+ h- \+ Z$ o, T; S: q; c
    (H
    ' o$ y, G9 _+ }- RT
    0 G' T& q! `; W) d LH) 6 U& A# b" T$ \: _5 w4 S
    ii% R; H: @2 y/ I* a
    - L- j; w3 S* p. H2 Y
    =tr(H - n7 z+ l3 N. r# c8 u; n* T2 X+ z; u
    T
    . b7 l. E6 u( h LH)3 ~% Q9 e6 }+ E; f: f: J6 G
    / a% V5 l8 Z9 ^4 d" V) F
    但此时H T H ≠ I H^{T}H \not=IH 6 T2 V% a7 S& B/ e" B- O# z
    T: W1 Y* y# |! x+ y, c
    H' F2 ]1 t9 O8 m' }0 I2 u

    ' F; h) \' q, a  T  y# L( \=I,而是H T D H = I H^{T}DH =IH
    $ Y) \: x" J$ W" {/ I4 V* ?6 q. a& tT7 _0 k: e- X9 a- A
    DH=I5 D/ y( D$ J3 E1 W- R
    2 Q( x2 L$ Z: f* X
    这是因为h i T D h i = ∑ j = 1 n h i j 2 d j = 1 v o l ( A i ) ∑ j ∈ A i d j = 1 v o l ( A i ) v o l ( A i ) = 1 h_{i}^{T}Dh_{i}=\sum\limits_{j=1}^{n}h_{ij}^{2}d_{j}=\frac{1}{vol(A_{i})}\sum\limits_{j\in A_{i}}d_{j}=\frac{1}{vol(A_{i})}vol(A_{i})=1h 6 ~: ]  K0 R8 K2 e# @9 k3 b
    i
    7 Y8 W. h* a1 W' w0 w4 y0 T# T, B2 `T  w) Y& P5 f+ X* E; S

    & z  c" |# K& U2 F% p Dh , ]9 s% g7 n0 A' {
    i
    0 w( f9 u( }: {  Q/ L9 y: z; {0 N& ~" A( {
    =
    : K# X$ S3 S! ~9 D7 T# p5 fj=1* A& }* F9 s; j& x- q9 M
    8 q: B, ?: Z7 ^  U8 Q. M
    n
    . F3 |! ?3 Q: P9 i, v, d2 s
    " r, J# d7 G( i& I: K5 n h ! x6 @- m9 S' {: C
    ij
    : ?6 h& o( Y* S24 E7 V8 E, b/ m# l5 U2 C( Y
    6 n6 F2 t+ `% H
    d
    ( U1 X% Q% O' Q5 _( Fj& f, S/ h" ~6 n  K5 b. g: g- C

    7 K6 C8 }  [2 d0 T! t = 3 H' I, m3 A; e. M/ j
    vol(A
    ) z. g& b. |+ ^) v$ _1 i1 _9 Di
    9 H$ a; D. a+ R, o* q, @# d2 |8 D8 i  \/ S+ |& h, J  t
    )
    ( o$ ^* C. Q0 t. E9 X' R1
    - c$ t* P! b, y7 Y5 L% Z* ^% m. U) Z, [
    6 |  v1 {- k' U4 L+ ~8 V
    j∈A
    1 ^+ k* |* u$ si
    + |" A0 o( A/ Y( E
    # R( C) L, m. F/ n- o( v% w0 X7 ^1 X- C! G) ^) s
    & E1 [# C, J7 [8 F; z1 m3 K

    * t: J; E  |7 F. g d # N2 s- X, m' f& P, D% r
    j
    $ H  ?& z  N$ u4 K. _" q3 {* K( {- g3 M/ a3 H7 f
    = . Q! U  X2 f# x# r- h
    vol(A
    6 O) t# `3 a8 h( ~2 \$ K' J0 R/ si8 J8 A+ O/ s0 K1 Z: e  R7 V
    ; B" b3 |4 A% m9 n5 ]- P; V
    )
    - f6 ^3 W+ P1 z, e' _1 X: g1! T+ S& x7 W  p& k
    3 F* D- e7 f, d* E& ]7 Z' r& F7 O& P
    vol(A
    ) N$ i) D, g4 {! m6 Hi
    , Z* Q& O. }& S6 W1 W
    " f$ q7 L( N5 z* w- B. w4 D, A )=1
    , R4 E% U" g* ^* M因此,此时切图优化目标为5 |1 B; G6 i9 M- o0 J

    4 `3 [- G3 f/ Q- ka r g m i n ⏟ H t r ( H T L H ) s . t . H T D H = I \underbrace{argmin}_{H} tr(H^{T}LH) s.t.H^{T}DH=I
    8 L8 u; a( ^5 Y  k) E) ~3 CH
    6 S0 M- B* B1 O3 P8 J' ~argmin% m' A$ w, L+ ?+ r1 N; W
    : X: P9 i) e' `  C3 `' S

    0 O3 b6 Y/ ]) E5 [
      ~" V& d4 i: o. |1 S tr(H 1 ^+ |' j2 i! _& L) n
    T
    + c$ w1 Q9 G; _, O+ [. j& { LH)s.t.H 7 e3 \% _7 _" a# O/ `* ~; `
    T3 R8 p) K% G8 f& Q! [1 g/ K
    DH=I4 b. B" u  c! F

    ) Q# w2 l. g3 t, \5 W$ V但是现在矩阵H HH中的指示向量h hh并不是标准正交基,所以需要对H HH做一定转换。令H = D − 1 2 F H=D^{-\frac{1}{2}}FH=D ! g# ~: K* O/ Q% ?

    , i3 \1 }: G6 a2' @, e1 f+ b0 O- F. K! Q  q+ ^) Y
    1
    5 W; j" U# c+ }7 m( Q4 N  p
    ' H! A" t8 g* Q0 H$ m1 V: p
    ) ?' j5 A- G! B) G/ n3 t F,则H T L H = F T D − 1 2 L D − 1 2 F H^{T}LH=F^{T}D^{-\frac{1}{2}}LD^{-\frac{1}{2}}FH
    . w- J9 `' u& y2 E9 l5 y, i* BT9 Q6 G/ U  Z1 A4 I
    LH=F
    : v/ D* k- j/ K' lT3 R3 j: m8 U: B  `
    D 4 W- ]" F7 v2 J  k
    3 _* f3 ?1 Z: `# m/ e, G
    2
    & E. ?, c3 {6 c1
    5 ~8 |& ?) b3 J% z
    0 H9 z3 i: {9 H3 }% {" k( L1 L! M0 M3 I+ m% d- P- \% |0 a8 ^' r- N* P, k- M
    LD 4 h6 i  V0 J: m8 A8 e

    * H) y2 w& b' U5 x4 X. X7 N/ U2
    ) e8 H8 o4 @3 [8 [2 k9 |1( O& k. v$ Q5 _
    * b) j* r, ?: j, Q2 F$ ~
    / h- H& m# z5 ?8 L$ i2 g
    F、H T D H = F T F = I H^{T}DH=F^{T}F=IH
    & h4 u& Y  u# `$ y6 A5 P# a! qT9 [% \2 v5 g: L& |, S: J- ^
    DH=F
    & K" n) @. L- ?( B: r% V8 s0 N0 @' C+ @T7 U& @6 E8 n( R: C0 b$ o
    F=I,于是优化目标变更为" K- y, w% o8 V" u
    a r g m i n ⏟ F t r ( F T D − 1 2 L D − 1 2 F ) s . t . F T F = I \underbrace{argmin}_{F} tr(F^{T}D^{-\frac{1}{2}}LD^{-\frac{1}{2}}F) s.t.F^{T}F=I
    : J3 F: m! b# N* O- Z7 CF
    0 c/ }8 n( y7 Nargmin
    5 m! W( z! \$ G7 p+ q# D% j
    ! I" [  ^: Q7 c9 P7 E9 ]  n5 k: g
    ( v+ c! f1 W5 [9 S! Y: {( E8 c6 R, S- F6 Q" E3 b! H
    tr(F % L) p! ^0 l+ ?) ~4 b% d, h
    T
    ; y( O1 x& G8 s; D+ a D 7 _4 H& ^! e7 W6 @$ p

    4 R6 z: Y) \+ S& F2
    ' @4 x  x( [. r1' w% y3 W$ R! q6 m1 E

    . V  K3 X2 H: T& s$ t- i' G
    * G  w- j1 i( X LD
    ) P( r! s! C3 B$ n% I/ W7 U* n2 W6 g7 v" |# z' ^8 Y
    2
      Q4 K2 P( x- c( D1# m8 A- U* S- M9 d' z  c
    , I8 }$ i" C- I! U. y( m2 V& l
    * Z  W: y5 E, X
    F)s.t.F 4 ^& m5 j% |# ]6 R
    T
    4 V8 q+ v: w) l) z" g; l F=I5 a7 F" g5 K9 ~
    7 D+ ]8 `7 G; q* A. I; j- t
    现在,和比例割一样,通过找到D − 1 2 L D − 1 2 D^{-\frac{1}{2}}LD^{-\frac{1}{2}}D % I9 e( Q5 G3 d0 M
    7 u  J0 |) o9 G7 X; P5 D6 L. m
    2
    ' r/ x; z' a& t& w* \1: u" T* U+ _% s* J3 `2 S2 v- d. R

      ~- a4 P6 w: w. ?3 `" y$ U! `# [' \4 V
    LD
    6 ^1 E5 R, Q3 M, e2 [3 ?
    3 y5 w6 h, a% C0 y2, D9 j- b( `, ~- C. X+ n4 p8 o$ m
    1
    5 ?9 n% l, `0 r" z2 a
    8 P, j( Y0 v: H" `6 \2 m. U$ \- C  F3 W! X+ j
    (就是之前的L LL)的最小的k kk个特征值,可以得到对应的k kk个特征向量,这k kk特征向量组成一个n nn×k kk维矩阵,也即F FF,最后对F FF进行传统聚类  w# D' L( I/ |+ M

    8 ?& h" W4 ~7 b1 f7 x: v一般来说,D − 1 2 L D − 1 2 D^{-\frac{1}{2}}LD^{-\frac{1}{2}}D $ d& {. x( M  s) g- O5 L( z
    1 o' d$ i: ?+ d6 j* ?7 y/ O+ ], x
    2. n4 v/ I+ D3 d4 `1 `* B  ?) U
    16 S: q: R! P" r. ^! l

    7 E+ T. [. ?% }/ l- Y  [4 o" Y9 Z
    0 F4 _. r2 x" A5 k5 m  ^5 S7 P LD
    2 |9 V1 u9 A9 ^4 S
    : u% l  @+ i6 n0 s& X, z) @5 c2, G. E9 P& V6 _7 q: b1 d- @
    1
    & D& v& v& R) L( F: m6 m% c' z2 q

    + N# R) s% z, C! W$ \ 相当于对L LL做了一次标准化,也即L i j d i ∗ d j \frac{L_{ij}}{\sqrt{d_{i}*d_{j}}} 1 M7 r6 u3 A& b  v3 J" h
    d
    " [* U  S( |2 P1 n" I0 f# S' e' qi( _7 d. ~1 R1 d2 O! d

    1 y, b; [' u( E0 h9 u& t4 W# j" R8 w ∗d 0 G& _# N5 b+ r5 H1 [; H0 [2 p4 y( j
    j
    ) t- T% x" ]: K5 K" Z7 M) w" G# n: [  w; v

    9 T) g8 i; F: P* y1 n
    - a" p: |8 a; E; t3 F8 ?
    % r* P1 h+ y- U9 P( c4 LL
    6 ]7 X& M/ C3 `4 W- H; ]" Eij
    ; C; x* Z7 o/ X/ Q, i0 M- [( Y& |9 K# o7 U. b& v! Z4 _7 R3 S

    3 `$ x! E; p! U; R) b$ c8 A
    % b: o1 w1 v* X3 Z# w! G. J. Z9 x/ O/ f
    二:谱聚类算法流程
    # O2 `; W6 E# d1 D* ^) ?/ F给定数据集D = { x 1 , x 2 , . . . , x n } D=\{x_{1}, x_{2}, ... , x_{n}\}D={x
    " m$ S% p# {9 p: F# U: E12 u8 @: `" \* v8 w- A

    ' j, f" a) O5 Q" G0 i7 s+ `% Z* _ ,x 3 q1 O( [$ a" `  C3 E7 B
    2* a4 p7 V  v( h; N! Q. u1 Q
    ! J/ D3 v2 L: L6 q: u1 Z+ f
    ,...,x 4 l* ]/ Q  X) z6 E) Y$ G
    n- G' \! g8 ~8 W/ K, F3 j8 g

    ; M2 b/ Y0 W# G: X' E }, p% z0 q( v' ~# r

    ) T* p; P( U9 E# S# m8 z) ~; j$ m8 F根据输入的相似矩阵生成方式(一般为高斯核函数)构建相似矩阵S SS(AffinityMatrix)6 `! v9 @/ A" [! H
    根据相似矩阵S SS构建邻接矩阵W WW,再构建度矩阵D DD
    % u4 b" R5 d! o& Z8 ]" ~计算拉普拉斯矩阵L = D − W L=D-WL=D−W6 Z  m. ~7 t% w" u5 _
    得到标准化后的拉普拉斯矩阵D − 1 2 L D − 1 2 D^{-\frac{1}{2}}LD^{-\frac{1}{2}}D
      _* g, ~$ a2 k$ J8 z$ e" ^0 d* A2 t- l' S) L/ a# n
    2
    # x6 }( G( N& B1- ^, g* w$ Q( J% J5 a9 o# O8 L) c
    / L( ?  |6 e0 K; S: }! K

    $ o5 j$ ]! w3 ^ LD
    7 {& ?% h  Z! }/ d( E6 C, v' q  Q" t- W8 j5 a+ L
    2
    6 g6 a: ~3 S* l, l4 C2 o1$ W7 C) J/ q! k+ l' n2 V1 X# p8 s
    4 F: U; }  h7 g) r1 C

    . C* d1 `* i1 b4 ]! L7 T
    5 Z  I" X4 O7 A* v' F, U计算D − 1 2 L D − 1 2 D^{-\frac{1}{2}}LD^{-\frac{1}{2}}D
    6 a6 b1 |: [0 C5 A  x9 N! X9 J) ]/ k7 G7 I5 T
    2
    3 K- |! s) X1 @' q1
    , Y' ?9 c% i: M6 k3 t3 W
    % v  |: h+ C  ~) T5 u6 m2 Y5 r1 a( y  M% K5 C; i
    LD
    9 |7 T. a( p; w. k$ B5 t" @) N; d2 K9 l5 g0 i4 Q3 X
    2) d+ K7 e. o& K% H* }* \
    1( ?* n6 b, h0 l: G: E

    % W, |( ]2 p6 b9 w8 R' u
    $ q1 V8 M' Q, w9 w! a; w 最小的k kk个特征值对应的特征向量f ff
    5 C9 P" T9 Z3 O: @+ Z: V将特征向量f ff组成矩阵并按行标准化,最终组成n nn×k kk维的特征矩阵F FF/ W. t2 k# g' @, E
    F FF中每一行作为一个k kk维的样本,共n nn个样本,采用某种聚类方法进行聚类,假设聚类维数为k 、 k^{、}k
    ' O$ D( }. ]6 X$ z/ U: P
    - q3 k4 N9 o2 r4 }9 b6 C% V4 d& E7 ]9 W" l! |. w  U8 w
    得到簇划分C( c 1 , c 2 , . . . , c k 、 ) (c_{1}, c_{2}, ... , c_{k^{、}})(c
    % {0 `1 E9 a# U; N1
    4 L) z3 D$ ?# P% i/ Q! J; N* C7 |, r# ]
    ,c # Q, V9 d  M: ]' }" P- E1 ?! D
    2) p# @. m: h0 W5 f; V

    2 q' u  O$ z& x. p ,...,c ) n0 d# v/ {, J* z  v9 ~
    k
      q, r2 ^8 \+ r9 q5 z) R( @% a  _9 o& P( K. F

    / Y, {2 t- G* i9 E4 c* s1 \$ a0 i, c3 Z
    )
    4 g" m- p: {$ ^% N6 j三:Python实现/ P! e' ^' C. |  A# U) F$ J
    import matplotlib.pyplot as plt8 X6 g& l! C9 M% G( j# I' W7 G
    import numpy as np4 X5 B% M3 H9 P+ a8 P: _5 ^% a8 @
    import pandas as pd
    4 C0 j" {% R" k7 d$ B4 U. n( ?from sklearn.cluster import KMeans
    5 v  Q1 N9 c: K% Wfrom sklearn.metrics.pairwise import rbf_kernel# E3 I3 j7 ^; s. ?
    from sklearn.datasets import make_blobs: e. @5 D2 S2 u7 U  E. V, N
    from sklearn.preprocessing import normalize
    9 K% y: y' i, i3 M/ a& m1 j8 J) `
    def get_affinity_matrix(data_set):
    , J: U$ S. s) b$ l; i    #  利用高斯核函数计算相似矩阵(全连接): b9 N% I6 n: D6 i+ Z. _# R2 f
        rbf = rbf_kernel(data_set)
    . }0 x, H6 q. r* A  p! N5 F  n; w    for i in range(len(rbf)):  t/ t8 I6 k* c6 M4 {: A+ E
            rbf[i, i] = 0% W- j3 P7 M) }; Y) G
        return rbf
    # B1 l1 R. Z" _3 }! [6 B; H7 Z% \$ z6 j' ^8 E1 r
    ( J3 C% }) l3 B- {5 i9 Y$ ?$ ?! h
    def distance(x1, x2):
    * r6 c8 p0 Q/ K6 u: u0 l8 Q' z    """2 s$ G) e+ i: f& m
        获得两个样本点之间的距离" O" A, b1 M6 L  q
        :param x1: 样本点1
    & B1 U; \8 v7 \8 N4 r6 B    :param x2: 样本点2
    & C7 g- I6 [- |8 t8 e    :return:: ~( Z! |" A1 y$ y' E% q% A
        """1 ~- ~: R! Z$ t! K3 k& u- c4 H7 }
        dist = np.sqrt(np.power(x1-x2,2).sum())2 S" w6 U$ M2 `- k
        return dist
    ( _# ]2 S: D& x" e( f$ o/ O
    : b- Q3 \0 B0 v) t1 f% w! jdef get_dist_matrix(data):( ^/ q, B9 i( d) l
        """
    ' t( k+ K. |5 R9 J1 t) V    获取距离矩阵
      v# H1 y2 X9 O) q, F( u    :param data: 样本集合; f+ ]9 l, r% W6 z
        :return: 距离矩阵
    4 H6 A4 w, u9 J6 \    """
    6 L% }0 e" [$ E2 O$ [    n = len(data)  #样本总数
    + G4 Q# p2 V; F, p    dist_matrix = np.zeros((n, n)) # 初始化邻接矩阵为n×n的全0矩阵2 B4 l; e- M* v, T) b& q! C, q
        for i in range(n):
    0 u3 h0 L3 d6 N        for j in range(i+1, n):
    9 ]' G4 ?- x, ~/ f! {4 c            dist_matrix[j] = dist_matrix[j] = distance(data, data[j]). _& C. p0 |" o$ B" C' s
        return dist_matrix. Y) Y4 l5 y9 t; W9 i

    " n4 c7 r5 R. F; y: `5 M( [def get_W(data, k):1 `$ a4 O0 x, ]+ R2 H( Q$ u
        # 获取邻接矩阵(K邻近法)
    5 |8 ?7 F' c& X- ^    n = len(data)1 I) |  T: P2 L1 F; B$ I7 x* e; f
        dist_matrix = get_dist_matrix(data)& c' J& ~! A8 F2 x9 r- ?+ P
        W = np.zeros((n, n))
    5 ^  r* H' c, I1 {  l2 O0 Y6 A    for idx, item in enumerate(dist_matrix):% _+ g! _  u8 x; N5 g, k
            idx_array = np.argsort(item)  # 每一行距离列表进行排序,得到对应的索引列表1 X' C0 q3 A6 p; x; B) A
            W[idx][idx_array[1:k+1]] = 12 a; a# S! S4 I  k8 @/ N" H
        transpW =np.transpose(W)# P  Z* `+ c3 f7 y& h4 \% z' [3 Y' z
        return (W+transpW)/2
    5 J: l: m1 k0 k8 ]
    - {) n$ l& X( `7 ?$ l" Idef spectral_clustering(data_set, k):
    - n3 X8 F' i3 c9 x! e    # 利用相似矩阵S得到邻接矩阵W5 _5 }* V( Z% ~/ g5 @% o
        W = get_affinity_matrix(data_set)  #高斯核函数(全连接法)
    3 x) I7 T" k: P/ G- u7 M  _8 z    #  W = get_W(data_set, k)  # K邻近法( |* W! A! d- f/ B: r

    1 U7 F, k4 h/ `5 U; d0 r    # 计算度矩阵D,并得到矩阵D的1/2次方的逆矩阵(便于计算拉普拉斯矩阵)
    " J5 X% g5 s$ r! g$ y; D- G    D_inv = np.diag(np.power(np.sum(W, axis=1), -0.5))9 S6 m* G8 F- x# g- O

    7 Z7 v; z( q; _* a9 ?4 i) j( \    # 计算拉普拉斯矩阵L=D-W
    ; W/ k# t1 c1 Y, P  w    # 标准化拉普拉斯矩阵l = D_inv*L*D_inv=I-D_inv*W*D_inv" N( |0 Z3 F& y4 s" o+ q& t
        L = np.eye(len(data_set)) - np.dot(np.dot(D_inv, W), D_inv): p# l& f, `! s' [; m2 R
    + a% v% b* X; ?. f
        # 得到特征值和特征向量9 K7 c6 Q/ j4 z( S. W( j
        eigvals, eigvecs = np.linalg.eig(L)$ c8 J5 c6 n- d2 A( l* i
    * h* j/ L/ e1 V8 J8 F9 X& V& l; N
        # 找到前k个最小的特征值(索引)
    + _5 I8 c$ R9 b% ^5 K% E& I8 v    k_smallest_eigvals_index = np.argsort(eigvals)[:k]
    " P, T/ p+ `- }- J& l4 o, \* v( v* V" @
        # 取出这k小特征值对应的特征向量,并正则化; s; j* }5 H0 M5 E% G0 G2 r) W
        k_smallest_eigvecs = normalize(eigvecs[:, k_smallest_eigvals_index])* X, q; a# o( |" r3 R

    ' m3 t5 a4 ]: G' O7 a0 n    # 使用K_Means聚类
    & s/ B7 N$ |7 t/ A$ j: F4 y/ \, H7 N2 J    return KMeans(n_clusters=k).fit_predict(k_smallest_eigvecs)
      J+ S/ g$ z0 ]
    1 E* ^/ j7 K, z# P  a, ~% w7 u1 Y1 j. @4 F$ [8 P1 z( d
    raw_data = pd.read_csv(r'E:\Postgraduate\Dataset\jain.csv', header=None), g2 b5 s9 S- ^
    raw_data.columns = ['X', 'Y']8 Y; x3 q- c" d4 ^% N8 Q
    x_axis = 'X'6 B/ j2 s* @* ~6 F- ?
    y_axis = 'Y'
    7 P' b3 s' y" _$ |
    # b  U  K  \7 \. n9 P- j5 sexamples_num = raw_data.shape[0]% d. `  K0 s$ V7 y& v
    train_data = raw_data[[x_axis, y_axis]].values.reshape(examples_num, 2)3 ?: |  U% w; M, z5 c+ C- n- V$ C
    ( i+ u  U. m) V6 q/ x

    ! o8 O1 `9 |) W  \9 fmin_vals = train_data.min(0)( u3 S- F' U8 {, |( }) M
    max_vals = train_data.max(0)
    3 \% r7 p0 [  _+ G( w! kranges = max_vals - min_vals
    - |" w9 \. }/ W, I: w' T0 Pnormal_data = np.zeros(np.shape(train_data))
    # d9 ^) ]# e  Z5 L- y4 fnums = train_data.shape[0]% L7 M8 K! j% L1 [& Z5 w
    normal_data = train_data - np.tile(min_vals, (nums, 1))
    : [7 x$ r" s& l. enormal_data = normal_data / np.tile(ranges, (nums, 1))" b( @+ q! ^  A
    : b. S# m! ?, b% F
    labels = spectral_clustering(normal_data, 2)9 h! a5 T8 D, A( p. H0 R
    9 K0 z  j' m3 c* N" N0 X
    # 原数据
    9 x: e: l& L2 ~  S2 ?8 x0 wfig, (ax0, ax1) = plt.subplots(ncols=2)& R- t! _4 c3 f0 M( a4 n7 m5 L
    ax0.scatter(normal_data[:, 0], normal_data[:, 1], c='black')
    ) V. I7 c4 ^( w. aax0.set_title('raw data')6 g) ~0 F: T) A  W, _
    # 谱聚类结果
    $ e% @/ ?& d* ]/ k1 P  Sax1.scatter(normal_data[:, 0], normal_data[:, 1], c=labels)3 I& u- x0 z& T0 T: |/ S
    ax1.set_title('Spectral Clustering')
    5 n; ]9 h( f7 ]- c. k1 s4 K. x! Z9 Q8 C) @; f. A
    plt.show()
    6 z% \0 S( m- f  L" V) P) C; O/ o* w9 C5 o7 K
    11 w  \! v8 P  U% r, h! E; o) r
    2$ h0 f# a' L& }* l
    3
    * c( n- Y! `& q# {% P+ M5 E9 Z2 ~4
    + C; R+ a' B+ d' R9 ^* [5
    1 F# F% U& l* R6
    9 _% ?* e; d8 O6 c7
    2 ]1 W: Z' [6 G0 P3 Q84 t/ r5 T5 X( ?  |, B4 i0 N
    9
    ; f- R& S* u8 z! X/ F, t4 S; |9 T10* I$ O- `3 R0 w6 n* x$ J# A. P* [
    11
    & J+ a. ~  M0 N( L120 _) o) }. e  `4 z
    13, l, ^6 k. q/ q1 r
    14& T0 V% }  S3 C8 h  h' i
    15
    ' G' Q% q+ D6 L. \* [3 V16
    & |4 Q& O8 p) b: h# j9 c) H171 a" Y5 u1 W# A9 x5 A
    185 J, M% S* a6 j# R( P5 m: e* o
    19% z# |7 T2 z) L2 g- E
    207 ~" b  k1 ?) ^; c- h- l
    21
    ! y, h) g. H* I; D% Z) g22
    ; Y2 ~2 [' m* s( S" |6 X236 }, l7 [' x  U5 w9 D
    24
    " @. q$ ^6 t' H& q3 Z25
    : y. s) U* i: m26
    8 v" x# G) U  Z; i8 S6 S5 c. h27) ?  z, w3 ?1 k
    28
    2 a% v: U1 k) m297 p% W0 v  x  v4 @+ i" g3 ]
    30
    % r# z% d* b0 w0 K# ~1 V31; g& S5 T3 g1 J2 @3 U' o- F
    32; e3 S1 ]8 a/ q0 F, b
    33( y% [# G$ K* ^* P: A
    34
    / c$ B$ D6 @; K) D! ^352 V# d2 q" W+ ~
    36
    9 z% j2 Y/ y- C3 a/ r" }/ H37% ~& e2 q, V9 W, |
    38
      r7 C% A4 t7 m39% e+ @! S$ v2 S6 Y
    40  D% y$ |+ a6 q  ~( Y- W, I3 {6 x
    41
    * E+ y- Q  r9 y0 x  f7 N& ?42( \, @" K. u; G" g% w
    43
    3 ~1 @! O4 V6 c44
    5 y* \) [" z# w3 B45( p) {- k* s/ O, p  S
    46
    & `5 t5 j* D# `1 U47- p! c9 |# ~6 t  N4 r; n( G
    48
    ) G0 Z1 c0 [- u, y3 z1 q4 C49
    4 p+ @0 L* @6 U6 d9 d* }502 @4 i: C3 m  o+ e
    51: H8 j7 k) }: x( A6 l& y+ w
    52
    - i! u1 Y% p+ @" O  Q) w( K53" C" }* F. t" u' \# |8 z3 g# N  j
    54# Q" d9 w" N# n% m; x3 {
    55; `8 h6 K6 u2 A, N+ Y( R0 ^7 u9 t
    56
    - ]/ J& p- Y* v  Z& ^578 ^9 s  Z4 `8 Q- j# B" l
    58  G0 }8 Z: A( K- k2 `( g8 \
    59
    9 R) U( `9 T2 \. x( N4 n( h" {8 I60
    9 F( O* E6 ?+ \. r+ `  d  e. |61
    / C2 F1 O" z8 C& j( j62
    - S) {+ d' z7 H! R9 b3 t634 {! y0 r6 [6 ^! \5 ^9 ~6 E! v
    64
    ( b" e% j9 {5 q; k- G" y9 W65" [7 [# `& @( k6 \/ A" N* ^
    66) P4 a1 S. V# y" P" i; f
    67, T! I: M8 L0 M% i% G' Y1 `; z
    680 ^* B; Q* ]# H" T0 P  D. N  _
    69$ N* n) R9 F. W# H7 U  G, s
    70$ I3 \( m9 o) u
    71
    6 y' I4 X0 j; |) p. Z% [( P72: w% A0 t; C" J9 q
    73* d2 T9 @, f1 z8 {+ [  I! ?
    74$ m( @$ H8 M$ n0 r& e/ J
    75, ^0 p7 @5 [! ^% v* ?; R
    76. d/ I. T$ V' o" y( C2 V% ?4 }
    77) R) W$ y, i% R6 i9 o
    78
    ! S/ O/ [" ~. Q79
    8 @: m. z1 ?9 i9 e- v: y80# f# C/ f# P/ b# Z( z8 v8 G
    81
    + q+ j1 F% q; _* o! F82/ Y1 e2 b* ^% _  s  c; y9 Q5 [
    83  `) R' }* r" Q! \7 m# F, `/ v6 J  e0 k* ]
    84" W& a) h( u  `0 m9 j
    852 i6 ^0 s5 q  ^9 j5 D! Y+ S
    86+ }4 Y" O3 _; T8 q3 `1 j
    87" ?) \7 }9 m6 c  V" F
    883 H: J- ?9 k  l& U% e
    89
    8 ?6 m0 [2 Y& f0 _- P5 V% @903 |5 t& q# T: S/ W2 ^/ S  {
    91
    ! _+ b  e$ h( T1 H) f92% s) u* F3 N0 N" v- u' }
    93
    5 K9 e$ Y7 A- d9 n) @94+ S# U$ N: l; X1 i, C* c6 ]
    957 j- {3 C9 R0 h, Z6 U. }6 M
    96
    ) v. H, V6 D' J97& C+ J% U5 F( Y. D* b) g
    98
    ( V: ]3 R2 |+ I3 M! x6 |99/ e) j) X1 M" Y/ ^# |
    1003 V5 w& @0 |- c2 X, n  R
    101! G. X  a. C; X0 o9 o
    102
      `  L( s3 H5 ]7 Z1037 X: |- c) k/ C1 t& r5 e9 x
    (高斯核函数)+ t+ `. V/ {) `0 [2 B% w' i

    & P* ]; T5 A: A3 s) O. _5 W" L; p' k$ b$ q) P2 _  X5 a
    (K邻近法)
    1 c+ p" m5 e! u; K8 l/ [9 v3 {) ~3 B1 }2 I0 _$ U$ q
    0 U- @" i" Z2 F! O( |7 z
    四:谱聚类算法优缺点
    + N+ b4 N3 @7 i# W! [(1)优点& f5 x4 b( W: y1 G. U% ?5 G; d5 H! P
    谱聚类只需要数据之间的相似度矩阵,所以对于稀疏数据的聚类很有效
    7 ~9 S0 e( }7 l使用了降维,因此处理高纬数据聚类时复杂度要明显低于传统聚类算法
    9 f3 H' J( S- x, u( @, R+ L谱聚类算法建立在谱图理论基础上,与传统聚类算法相比,它具有能在任意形状的样本空间上聚类且收敛于全局最优解
    & M& I4 U' j. g; u  E1 K# c(2)缺点/ i9 `8 X" K6 v+ v( ^
    如果最终聚类的维度非常高,则由于降维的幅度不够,导致算法的运行速度和最后效果都不是很好
    ! \, o! d2 o! P3 U4 A$ T聚类效果依赖于相似度矩阵,所以不同的相似度矩阵得到的最终聚类效果大不同相同
    * k' o" p* i& }4 x( \————————————————# f8 K0 E) h5 w0 K5 u5 E& J. S
    版权声明:本文为CSDN博主「快乐江湖」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    ; T0 V, ^( M+ G9 u, ]原文链接:https://blog.csdn.net/qq_39183034/article/details/126747494* a  l! j! F- h" ?

    / J/ P0 ?8 H/ F, a, ^
    1 ?7 G' u0 \: V) n( d5 ?5 F
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-8-18 16:14 , Processed in 0.522250 second(s), 50 queries .

    回顶部