数学建模社区-数学中国

标题: 三分类网络的物理意义是什么? [打印本页]

作者: 杨利霞    时间: 2022-9-5 16:30
标题: 三分类网络的物理意义是什么?
三分类网络的物理意义是什么?6 D1 c7 u) y6 \7 w

- _4 G  p$ R7 y' B! M9 R
) }; C' K+ g0 w: E8 g! g( K(A,B)---m*n*k---(1,0)(0,1)6 L% G; X* G6 H6 Y

& E' s6 ]0 G! O9 k/ ^( o8 C对于一个二分类网络可以将被分类的A和B分别理解为粒子和环境,因为粒子处于环境中。于是A和B之间的距离可以理解为0。因为t=s/v,则即便A和B之间的相互作用的速度小于光速,A和B之间仍然可以实现瞬时作用,并不违反理论。$ ^& I" j; n1 D4 Z

2 n& Q, T9 @& k' A( A, B, C )---m*n*k---( 1, 0, 0 )( 0, 1, 0 )( 0, 0, 1 )3 v; D" V3 I$ Q2 Z' x( \
/ w& d2 |" z+ T) s. e
对于一个三分类网络要完成3次形态的变换。A⇋B,A⇋C,B⇋C,每一次形态变换就是一次二分类,因此对于一个三分类网络可以理解为由3个二分类网络组成( U( E; k& V# T* F, i
# ?# _: ~1 N- k+ S! b; X- g  Z
(A,B)---m*n*k---(1,0)(0,1)" c0 g: V# N* j9 x/ B# i7 `

2 b+ v, _8 d! R2 X  B(A,C)---m*n*k---(1,0)(0,1)
* F+ @3 g$ W( j$ J% `% s: \+ M% H; A' e! B, I) {
(B,C)---m*n*k---(1,0)(0,1)
7 f2 Q9 T4 m6 d9 _
# p8 T; g4 [6 T* i! G$ b 这就意味着存在3对瞬时作用,也就表明这3个粒子彼此之间的距离都是0.随着时间的推移网络的收敛误差会不断减小,而网络的分类准确率会不断变大。这个过程意味着A被错误的分成B和C的成分少了,同样B被错误的分成A和C,C被错误的分成A和B的成分也少了。
3 g" j7 H: ^+ B3 @& G8 N3 [3 X  v1 `& a- o8 d& ?; N0 R
所以这个三分网络可以被解释为,3个距离为0的粒子不断的相互作用,随着时间的演化,最终变得越来越像自己。! g% i  W, d# Z* v' x
* `7 P, x: Z8 u. y) l! f8 d/ W
而前面的实验表明相同收敛误差下,迭代次数取决于等位点差的绝对值的和,这次就继续验证这一猜测。
3 Z3 S' E% y' C! F; D- u+ t. K( z( k0 q+ b( Q
用的训练集是mnist的0,1,2,3,4,的第一张图片。用间隔取点的办法化成13*13.
, K8 ]- {* i6 i$ e/ U' \- z+ G1 Y8 ]+ R* ?* I) z( S. m
( 0, 1, 2 )---169*30*3---( 1, 0, 0 )( 0, 1, 0 )( 0, 0, 1 )这个网络简记为0*1*2.就只有3张图片不断循环往复,直到收敛。共进行了10组得到数据
# O; b  A6 A) O5 q' l" ^' J' T( u) Q2 V6 V) I/ E6 m
1*3*4
0 s6 a3 C( X5 D7 o6 Z) B% E* \2 |- K/ |9 d( t# J
2*3*4
- p1 |! C/ ?1 F# _9 D
1 y# R6 x7 S: b' p0*3*4
- t4 J7 I8 B+ |1 Y
6 d6 a4 a3 ~! b0*1*4* d) i$ t5 z9 O/ a, i( A4 O5 x1 u

# x- e) E& M  A3 f0*1*3
$ U8 O4 |; F7 n6 X( b% e5 t, W( b4 G8 D' e* _' j4 ^0 S
1*2*4
0 g- R0 ?# q1 d7 R; R, X$ a1 L- _
" b' Z% T" `' `5 }" k  ~# i$ ~1*2*3
+ I4 P# t1 X7 i3 D& H( f, q
/ ]8 n4 L& Z! i, Z/ W% }& Z0*1*2
$ M/ s5 |/ O9 K& Z( @6 y
8 E2 ?5 G6 G5 p, ^0*2*3
) r2 q6 C: P; Q
9 s  r! M# t; |0*2*4
5 j$ q0 D4 c7 B+ Z8 \/ j0 J( Z. ~6 X
δ
+ `/ s& B' U0 e. D5 ?
7 ]3 Q/ O; h) h迭代次数n
( j! T- q. R  @* O6 d- `6 `: b  D
* s4 {9 U3 b2 W9 [7 F) b迭代次数n
) g4 d- g8 ^7 S9 ^
2 X7 ?& x5 c0 s' E( q迭代次数n
0 E, g* m% h9 J" v; \. L  \( [( U3 w
迭代次数n
( ^: K, `$ U# t7 g' j, E
; ?/ ~; a5 F& }' ~; ]. U* f迭代次数n
0 S: d: P. P; p" W+ v' \" J
3 V' U: s. |" I迭代次数n/ q; x4 U! M+ _
0 d8 I# F/ `& @% O8 t( N
迭代次数n
& N! W  G4 t- y, E+ p+ ?3 R
3 [% v3 s4 p( D* N0 A迭代次数n
0 f5 i% ^; m' W: d& z2 M; g- n9 B3 t# q* M: W: A
迭代次数n
2 x' X4 Q' h9 P: f
1 z; {8 n5 o' K迭代次数n$ f/ ^' k! o4 F; G4 g9 [

! T9 ^" C6 a, B- s/ g; O9 u* d. P0.01$ p! Z/ u8 Z. v, c

% A8 O/ w+ p) Y7 K4 Z! c) y0 t, P1763.1809
( ^; ?% A* d. M1 C- ^( T$ l, |
6 F3 K5 U- G/ D4 f1626.57299 z- V6 H) ~: M+ ?7 t9 D9 g$ X
) A0 s0 x' J8 e) y  m; Y
1672.4523( i9 A! ]$ K# H: U! L/ ^

; }* L1 @1 L( g$ B" X! b1635.9196% c4 W* y# k8 Y9 S

5 D4 \; d% T- k1596.7035
* t& m* D4 c. h! x+ K& J. Q7 R/ Z/ M2 U! A
1620.407$ X- C8 ^6 {5 J2 L* c" t. Q
2 u' S) N* E3 J& C: G( v; k0 ~$ D: @
1563.8945* i( Q6 i* l- O; E
  f/ P- o. M7 D- r7 t
1444.2915
& e- U% Q' x0 [4 N4 c) a1 G* X, G# [+ }3 e! S- o2 G
1410.0302
, v9 h* R2 R, Q, Q  S1 b* s0 Y4 z
) z, _. {$ v9 [: R- Y1465.4171
$ P! g) o# y5 S& a. x1 O  F4 t4 u" f; q; @% h0 ?0 o7 E, u9 N0 ^
0.001
7 z0 H; e7 ^4 }9 U! d- \9 v, M3 K" ^
+ [) j1 l7 L* g& P' G13065.196* }. n! f4 r0 c) g$ `
. ]2 t0 z) ~" o1 v0 C9 ?- O, Q
12674.9458 D0 O7 g7 u, F  k2 V2 ^

' H  ?: R# x' z3 p) y# V12747.729! h" R, ]# L2 `. X

3 |4 U; }" N! l, {, b/ M3 p12386.2168 F2 V3 D! ?( d5 N; {5 |2 m  {% b

. f5 X' t8 V7 j0 A8 C+ o5 \12349.02
- S9 H1 }( y- P- u  e* B9 x  R; |; h: p. E
12282.201
# U' L- w) y0 K5 ~8 O1 M( \- Y9 ~* Y# @
12270.035
9 ]- O9 y  v  [+ {
* t1 m! }  Z" }+ k$ e6 N. G11338.4774 L2 V% l9 c$ Q% l1 W
4 c' ^' G; f. Y, x! x0 L$ e4 B" q
10985.201$ n) ?" v1 G- f+ ~% r

3 ]. J2 l7 v0 F2 A11015.503. v4 ?: ?* y+ q# q; D) ?

8 D/ G% p' @0 V+ I5 ?' r! M% E9.00E-04
. Q) G7 f  C' i( Y
5 S- \/ l9 t5 X+ Y14352.4524 ^/ l: @' w& b

' Q) v; s9 B  \( K* L: o/ g% ?14004.633
9 D6 ~) N: U6 f0 Z2 [0 q& K* ?' z/ z  m8 Z' g  q7 p6 l3 n" Z# U/ v
14062.829; ?; U+ Z1 q0 h# ]

* d0 M$ }5 Q1 i) g% ~; N13629.467
: o+ Z" V9 K5 ?7 e/ }  @8 ?9 i8 w* J0 I% f  G  k
13613.362
4 `2 s2 o: O* z0 R: G0 I1 ^4 }- n' U  p+ ]  c' s  d
13609.563$ t8 q2 V+ t3 h( g
- K$ H8 m0 d8 N6 d
13530.322
9 b2 h) F% ?. [5 f7 S4 ^. P. C+ g! M/ A
12458.171& m) e7 k/ B$ J; ?7 x/ t
( f* n4 c  u: e! s8 G- a/ a9 C$ A5 z
12176.362
9 i$ K6 l$ N, m7 F' J4 [( M' \2 b; V6 u0 I. p+ ^4 P" i
12225.96) j; K( V8 f" X+ T# x$ y! \

" [9 t* M( u$ h4 d+ X0 w: S8.00E-04" T7 o4 \, P# y0 m7 j
6 s) D8 u% C2 ^  H- X" H: U% N; b
16141.206. n8 O0 f! L, x$ `1 k, X
: h: G3 N! u0 f8 u% l! ^1 M5 G9 H
15611.101
5 p" M, V' r& l0 i
* T6 x, x4 F6 ^  p1 ~; h15749.91
; n, O/ P% ?6 C3 h9 ^* F' ~
$ H( @% R0 o: c& G15264.98. u) H/ [: \$ m# U6 A0 B# K
$ E4 b- V% c2 c$ e  Z. i7 P
15228.447
) {: `; X: n3 j
! n- ?1 a: F* d: X1 O5 e7 v15207.628- C, \, M+ X# d9 e: D" z( I

+ d2 V3 c9 F* ]" c% B8 N3 \: y15053.7142 z" @" g) u& Y+ @
# I: R; ^; s" v: j( {( V" G
14044.729* q1 U" E' y% G: ?% B& O
7 _: C0 }# J# y" z  @
13530.397( s) O4 S1 v7 U  K" f9 w, i) ~
+ ]( S0 t( g3 \4 a! a% T+ a- B
13654.678
, P" U; B9 p2 Y6 C6 }
% ^" Y* i# s+ i! z# P' a7.00E-049 ]# v" \7 X2 ^+ i3 m
- N- U/ s1 v& a6 @
18194.397
8 Y) U/ _: m0 g( A5 J' a' c; K; L. J+ Y7 _8 {. [& o) d
17760.638
0 _; ~5 Z: i, a/ M3 ~
7 d* Y% y2 g: K1 @" X: P17743.578
2 ?# T" f8 s5 X% U5 `. W
# b9 ~/ y# C' ?& g6 O8 w# r  G0 p% S17333.377
* r1 b& l1 P' N7 V7 C0 m3 }9 \6 r. p" d$ `
17293.874, U. n3 Q  M* N4 {$ b; X: b  r

8 k. s' e  \- K& g5 x, B5 |' c) H' @17204.638
/ g/ u9 V. O3 y& Y+ B
+ d6 W% P3 U. I. }8 f. M! K17058.809
" @4 K: W  |! T
) `) K. O0 i6 o- O& t5 I15946.101
8 L% H$ z8 q# J6 b* H1 t" K! s1 p# `& N; [
15491.266
0 K5 x* d5 u1 j8 E  k
+ S& e( X7 @5 s+ N) p15399.538. X2 Z% S' b0 P5 _7 f1 J" Z: ~
3 ~7 h% m+ b! f
s
/ h! b) \! x; _  E" z) m* I
* B/ m) }1 N+ Z$ B. P; G130
: c' ]9 ]; O, |* O2 N; \" o8 k" M" R' w8 \
218
' h# @0 i& X2 {. V7 q
6 b' h7 b2 M5 q/ I2 |2 J& \/ ?198$ @6 y% g. _8 ~+ c: ]
' m" v. `1 R% y3 M
206+ ~4 x- c1 h+ o! ?% T  ^% s
! z% |( X# N/ ~& s7 ?6 |
204
4 ?9 ^; ^! M0 y; p! q0 H8 r  }6 J, Z
218
& D1 ]# H9 s( r& ?
3 Q; @; K1 [0 E220
! e7 F# f. {3 F* ]- E
6 U0 d* |8 A) N3 j2 C3 S204
6 e4 a+ p3 R+ G- k8 M
; \# p# j+ q# f( q1 b220
, Z6 `( [% @' @1 }+ D$ S: g
2 p  @$ G" @8 e; D4 m# \& z8 C2165 h8 R. Q  a& n+ w9 P( |, ?

5 l! y9 c6 F: z+ I将收敛误差为7e-4的迭代次数画成图
: c" X1 P& w1 g3 m, q& B* X' \6 x# Q' N
8 t( ?$ E( z% j: {$ U) z" z/ C
3 m( H/ k9 S) H: ?' q8 v
再将移位距离S的曲线画成图4 j/ a. T  H$ A

# Q( ^3 x0 B9 k; `, j$ t/ ^0 w' n: n" T* a1 t! o! x

% c7 K/ M) V, |$ U6 r  T2 a在这组数据中s和n之间的反比关系依然存在。
- ]( k: \0 H1 [7 g( B
! }1 N& w% z+ k3 O. b  o8 I移位距离假设
- `; l- B% j8 U* ?) w
  `8 r4 C4 s* G5 H) ?(A,B)---m*n*k---(1,0)(0,1)
; \, [  l6 C, j+ y2 u8 p1 U
& {# `9 _6 B/ Z% y, X8 w' q% r1 p! @8 A' c/ `

, r$ r1 Q& L* N2 R用神经网络分类A和B,把参与分类的A和B中的数字看作是组成A和B的粒子,分类的过程就是让A和B中的粒子互相交换位置,寻找最短移位路径的过程。而熵H与最短移位距离S成正比,迭代次数n与S成反比。
: F# _* D4 a6 j+ a" ]1 @# L+ S$ U% }5 C+ \4 Y( k. K
移位规则汇总6 k# F# @+ l5 G& T

+ H% a' E% v. c" ^移位距离就是等位点数值差的绝对值的和S=Σ|a-b|,如果训练集有多张图片取平均值,如果是多分类问题则移位距离为所有两两组合移位距离的和。
& {+ ^/ @) C- R7 \0 ~" c8 n( R$ U
9 Q7 `- V+ }! s) f如对一组3*3的矩阵# G, F0 s& L" g+ D/ C

* b0 }+ D! ?+ x  j+ U, T
2 _% k7 K0 h/ N+ X0 h! }3 q: d3 ^6 ]2 ~! F1 p5 V+ n3 {1 f
S=s0+s1+,…,+s8=|a0-b0|+|a1-b1|+,…,+|a8-b8|9 h" N+ p7 J+ c# R& l0 _

" u, H. y+ V) E( F7 O' \如果是3分类问题,就应该实现3个形态之间的两两分类,也就是要完成3对等位点之间的差。
3 H6 _% c% {* p- F/ \0 ^9 H- C* x  b, d- `3 V5 t
/ x4 Y' R" _! q( e  n# V
. Q3 g! D& k  C; Q. d$ m
因此移位距离* i" p: s5 I, X8 Q% b
9 a" C1 }% h* Q' c* {8 N7 L
S=Sab+Sac+Sbc=# a, p: r! W% x* Q7 @* C6 w% v: J# Z
. K3 X% z" X. P$ J3 F! p
|a0-b0|+|a1-b1|+|a2-b2|+|a3-b3|+% P2 u& g" n+ r# i% X: k: b

9 A: I4 B5 Y  o/ A: [|a0-c0|+|a1-c1|+|a2-c2|+|a3-c3|+
! E* w/ ?* ~; ~% f& P" O3 u1 V; T( ^0 V8 K  |% Z7 I
|b0-c0|+|b1-c1|+|b2-c2|+|b3-c3|, `) e  D* s) |) v
————————————————, @- x- M! r% m4 Y  T
版权声明:本文为CSDN博主「黑榆」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
0 Z6 `7 R: E. p# k) V% y6 a" t原文链接:https://blog.csdn.net/georgesale/article/details/126690670
) l: M% q, G; p8 h3 Z, c1 [
) H2 f; G6 X) }; K5 J; S/ i* o* L* X( }





欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5