数学建模社区-数学中国
标题:
三分类网络的物理意义是什么?
[打印本页]
作者:
杨利霞
时间:
2022-9-5 16:30
标题:
三分类网络的物理意义是什么?
三分类网络的物理意义是什么?
6 D" t+ h5 ?: U' q0 E
" `/ ~/ M9 j6 O T m
3 f$ D# O l8 l/ K) `
(A,B)---m*n*k---(1,0)(0,1)
% J" s) n7 R6 p2 \
+ e6 O: L$ }: J y8 a
对于一个二分类网络可以将被分类的A和B分别理解为粒子和环境,因为粒子处于环境中。于是A和B之间的距离可以理解为0。因为t=s/v,则即便A和B之间的相互作用的速度小于光速,A和B之间仍然可以实现瞬时作用,并不违反理论。
& T( p, r$ N0 Q; H* v' R! u
$ y! @7 n4 f3 l. W _% t/ ^" h
( A, B, C )---m*n*k---( 1, 0, 0 )( 0, 1, 0 )( 0, 0, 1 )
5 D+ W5 E1 _+ W3 P/ n4 Z
# l4 y* {; B8 N9 w, P4 B, i
对于一个三分类网络要完成3次形态的变换。A⇋B,A⇋C,B⇋C,每一次形态变换就是一次二分类,因此对于一个三分类网络可以理解为由3个二分类网络组成
- o3 k. j- R# j; z9 }
/ |% H1 L1 B8 k- y( q
(A,B)---m*n*k---(1,0)(0,1)
5 F d: g6 W3 f
- |5 h$ K# [! [1 `; F5 V
(A,C)---m*n*k---(1,0)(0,1)
4 S+ X7 D$ s; l: N& z7 Q. H
( U0 c8 s3 p2 \/ i& P
(B,C)---m*n*k---(1,0)(0,1)
6 d( b9 n/ V5 X _4 p& V" T
" m* U4 @9 z) W% b: l7 m: o
这就意味着存在3对瞬时作用,也就表明这3个粒子彼此之间的距离都是0.随着时间的推移网络的收敛误差会不断减小,而网络的分类准确率会不断变大。这个过程意味着A被错误的分成B和C的成分少了,同样B被错误的分成A和C,C被错误的分成A和B的成分也少了。
3 h" R% y3 y+ u5 }
! I0 H- W! J7 X
所以这个三分网络可以被解释为,3个距离为0的粒子不断的相互作用,随着时间的演化,最终变得越来越像自己。
+ ?+ I; f/ @& i2 J; X* Z' w
, Q0 L o8 u' ]0 ]8 M2 N4 \
而前面的实验表明相同收敛误差下,迭代次数取决于等位点差的绝对值的和,这次就继续验证这一猜测。
* e" ^% ]. e7 M# F; I! |% R2 H h
/ C9 w4 w7 ?6 N8 h
用的训练集是mnist的0,1,2,3,4,的第一张图片。用间隔取点的办法化成13*13.
9 r/ r# G6 z7 b8 R2 S
4 ]5 B+ o K4 V1 W2 @5 q! g
( 0, 1, 2 )---169*30*3---( 1, 0, 0 )( 0, 1, 0 )( 0, 0, 1 )这个网络简记为0*1*2.就只有3张图片不断循环往复,直到收敛。共进行了10组得到数据
5 o8 c- d$ e2 I9 c
! ?1 n E5 u; Z
1*3*4
$ `- i6 U4 A, k# _( K
# w4 e2 p. v) N; Q6 g0 q3 _
2*3*4
9 ?( W7 b" D. F
; Q9 ]: ~6 y* ] n3 O! V1 c
0*3*4
# X* G Q; o7 t5 g
# J8 ?. @# \% X
0*1*4
, i. Q! @& _2 Y5 v6 v+ r
/ _/ l( `+ h- M+ l6 J( h H
0*1*3
- E5 u' }* R" X! X$ B4 s
7 i. C+ {3 `# U6 F9 Z& O' ?
1*2*4
2 f5 d8 G# e7 j
6 G( N/ ~* S- Z. s
1*2*3
3 A6 n% g) Z }( P# s
3 D! @; I! G4 Q$ n5 n o8 S
0*1*2
- O( u$ `0 J2 k
3 u/ a: x( X% {7 W
0*2*3
2 [, ]- Z1 _- A
" o3 R, k0 N% U Z& Z9 I7 ]- p9 E9 B
0*2*4
" c4 R8 {! v7 j9 Z/ U/ w8 D) f( g
* c! X L) w; z( r3 h
δ
2 O) g; s$ Z/ N M; D
. T5 {$ I( L5 S7 I0 X, }" f
迭代次数n
; j, k5 o* p1 Y
8 e( I" P; n4 s0 X; L1 i
迭代次数n
" ~6 l) H8 @4 F
0 A3 o$ x% @$ ^4 C
迭代次数n
- |9 I! ~8 w. o: ]
3 D9 q/ l8 S* O7 f+ z _) u+ J* F% @' T
迭代次数n
# t0 l# z( [3 H/ W e% J
! s( X' Y Z% F5 j' h3 [6 m
迭代次数n
5 w1 x2 R: H) D
4 [+ k# C( F* x$ O- R
迭代次数n
7 K, ~ C9 s; T# L' }9 ^
& p% w7 F7 a8 T, ?# R1 K0 ^
迭代次数n
( H8 d' J: K2 c! F
4 g. f- Q3 @1 I6 ~
迭代次数n
+ O( b/ D/ L0 g
' W! x9 |3 J Q' M% s0 T6 K
迭代次数n
- G z/ D: O5 `+ g J8 D% _
1 r0 n# s+ K' ^& u, o) a
迭代次数n
: E9 K/ p u3 ^' ?
- r# e$ Y2 o' q* ]: A. [
0.01
3 p7 ~9 x1 Z5 c* m4 l9 \% G
7 \' y" m' j0 l e/ n: i
1763.1809
2 w3 O& a- a& e. R& y; x! D
/ A/ q, ~! C7 [5 A7 _4 s9 }
1626.5729
; @% a3 b+ z9 e. ?
, u4 h5 z* i: S# V* N! ~# N
1672.4523
9 Z1 I) B' N: N9 j: z
9 Q# W; L. G$ t4 {* W9 u
1635.9196
4 p5 _9 I8 b% C% `" D/ a
) {* e4 y1 Q2 l; [8 @4 z
1596.7035
, _1 f/ D0 V" |3 A6 w" @& P n
) ?& d, x% Q5 ^0 a: N
1620.407
1 w# x# T$ K! {" Q5 n) ~( J
" p! N9 O, J& q+ K' k
1563.8945
( b) |4 A/ u+ r) ^9 ?
" z* D2 _ Q" W3 D+ m5 l; o
1444.2915
- f+ R$ O9 a) G) ^4 ?3 J/ I# F4 `
4 h. I ~0 r4 `3 W) \; D
1410.0302
: G& E( S# @7 }3 C
9 H' a, K1 W( N$ Y' V1 D6 k
1465.4171
& O/ j# W( P* \
' t5 s+ @5 a1 G6 [4 K W
0.001
! z0 c9 x2 T1 X3 y/ j' I5 p3 l, ]
3 L5 I ~6 C9 m9 H+ S/ a* K
13065.196
9 B2 a: A3 y! M3 \8 n
8 ^& Z+ X/ N& g: P! u0 `- e
12674.945
7 E/ M5 G, ~" K1 w, t% c* I( g# @& I( H
) x" u4 Y0 a; v: g8 F1 P4 w) u
12747.729
& M" ^ R0 J+ }/ s# O( m
/ q: X' i" e+ D3 `
12386.216
, H+ W2 G" M {1 d: _( I7 y& m
8 _5 c4 q& A7 {* v4 @* p
12349.02
* X2 d# t/ r# v( [+ M
+ t/ n2 _( A! t
12282.201
% h$ Y/ {; L/ [) T
- C, Y- V5 ]* f* F; R/ \
12270.035
7 y$ j: w& [* W
) A3 X% g( u9 r9 W9 ?& B
11338.477
4 Z9 e, s5 H0 g
( P) e; Y6 N8 C. m
10985.201
8 [/ z, h% u( Q
+ B& G$ u; Z& C9 ]* ~
11015.503
" x; Q1 F2 x; n6 p$ P
: C# U8 e, i4 {1 G) @7 N8 g
9.00E-04
0 k. b# \3 d7 I ~5 T+ m
; I# t1 r7 l2 E6 E. E
14352.452
6 z9 }7 ^. Q! Y7 h+ @5 p+ @2 W
5 ~& n/ e: K# X1 w z7 G9 ^5 Z
14004.633
4 [5 k; L( S* K$ H0 \
5 k5 V0 y: z) ]: {3 w5 Z( `
14062.829
2 T& N6 A/ B! q( L7 m8 y: R8 J/ _$ e% Z
4 d0 [2 P- }; Y* l
13629.467
9 ~2 a0 b# u4 o8 x- a! h) Q8 s
|, l0 L( {4 B
13613.362
5 Q* }& P* V* k$ W+ c6 r
! [* i/ a! E) T: g3 C0 _
13609.563
h) z2 B' d4 O1 X9 R. Y
. G3 ]! i1 @8 v1 M, {
13530.322
( b, @2 w! G7 A- a( z( R2 g7 _
; w. K. i2 F- w$ {3 t. p9 A2 C
12458.171
/ W, G8 V$ j: J' c. `4 I
9 Y2 E" a& u# h4 \
12176.362
- F" p6 k; B! U
7 T! i' c: ^. ^# i/ K! \( s
12225.96
9 F9 b% F2 ]: e6 f' v h
9 y- Q( y- \$ _& m
8.00E-04
4 z0 g$ H1 W* q7 C8 N( N" b
- M0 \) `7 O0 d$ f* k
16141.206
( \# x8 O& A2 m& f( e
( T+ m: ~5 w2 B& `) |
15611.101
4 W4 ]9 Q4 R! H6 H) z. C' i2 l
G3 D( |6 a9 Q v
15749.91
1 J" f% B/ P5 P+ C
! y0 q- h# e% P# C9 t/ W+ s
15264.98
. f- O k0 v! A1 \
* c6 [ N1 ?" X7 A1 V+ v* z. \6 [& Z
15228.447
* T4 n- C, r; _' Y/ l+ L2 \5 d
& b( m* y$ D: a2 [6 V7 `9 h t
15207.628
8 V8 c" g0 v4 X6 o2 \4 k3 S: `6 I
6 \ ?; O$ b: t6 c: ~6 Z2 d q
15053.714
* W. R0 B0 b9 l3 g+ Z2 {% d
% a4 I9 `( M, h _9 C
14044.729
6 e$ k' U4 J! p4 P, s3 p
' ~: C# p. @0 \
13530.397
4 T/ E, K! r( Z+ M- D5 G
9 C* g: R( V9 N. V& K
13654.678
* t' _; F8 Z; `4 c# f& z
- k: [' k: \# [0 d: z$ L$ o+ z
7.00E-04
! Z% g! h5 r ?7 O$ O' a/ R2 b
, g! U' ^. N; T6 j0 Q$ m0 n# e
18194.397
. b) ~) B# F: ^9 J: f
9 B" u; \- w" |" S) i$ P! j
17760.638
* m5 P1 F9 V ?/ E$ p
) m) O7 E" ^' q) c \
17743.578
2 _$ Q* s+ E9 u. t: I
3 e: Q7 k6 s4 c! J- p: U
17333.377
1 v6 n' s3 A: V4 e
. @9 q6 D: z* F$ l
17293.874
) w6 m f: i2 x! J
! ~' I7 }3 s: f6 r1 ]2 v% s: H! }
17204.638
0 h g4 W x, \! r1 W
) o E) H6 }- S. c6 w
17058.809
+ B' A& L" ]" U5 R
; A8 j* a" B1 z& ~& I, h* C
15946.101
! Z$ e* N! X; {5 T: ?2 C
! C! ] k2 N0 ?9 f' k) _
15491.266
# i6 J$ T$ L. \5 B2 z
" j4 m3 p4 O3 k+ C- |
15399.538
+ T+ E; Y1 Z2 D$ K
$ N& N: k8 B0 f4 T8 ^
s
' d+ s9 c4 {# S( c' {6 B5 w* H
0 l: ~/ E3 f3 M* e" R5 l
130
" A N5 F) G) w# p/ [
; _2 U7 o* Q* V# E! I; E
218
* U& j2 j- T" T {1 i+ s `) x
# l" \' y3 x8 X2 N9 p' l
198
( q. I2 W( O* q' ~& h( m
8 Y9 x. L% D( f \: v
206
: X; B+ t: o* @1 d. o) ?) F4 U
) b1 J8 I& [4 B/ A4 u2 p" P
204
4 E; B5 R+ E8 e3 H: j
( H6 }4 c' E6 P! q, t0 N
218
- b1 n2 `- K4 c- N6 ^5 W! l! X
" D8 f6 I4 f1 H' |
220
; D% i* h! c; K y$ K
# Z3 j0 W! ~# K# [1 ?1 ^, j
204
% y4 M! Q8 G1 z3 |; C7 F |
4 ^6 V: q- A/ L# Q9 D/ _3 S
220
' y" Y& U N6 s' G
+ u; h8 g6 o: m$ C5 f5 r! M4 ~
216
; r8 z ] O' Y- ?5 Z
' e$ [: j. Y/ H: \6 l A% L+ |$ A
将收敛误差为7e-4的迭代次数画成图
" K* U7 u9 b+ m) d" I1 [# {
' U" u! Z/ P- n+ Z! x
* j/ ^( ^! d! y" Y. s( j
# D2 o' z0 F6 q1 b& C' j+ w
再将移位距离S的曲线画成图
4 d/ l5 F& T9 q
3 f3 B: P" U; r$ j
7 _* R) H4 E0 _. X# e9 g, m9 C/ ?
! Y W1 X6 s/ f
在这组数据中s和n之间的反比关系依然存在。
0 V* W! C8 q8 z; O7 X& @
" R0 V% U' }8 Q
移位距离假设
8 U* g6 d* \) Z* e4 K
5 K' O* p4 p1 p( l: V
(A,B)---m*n*k---(1,0)(0,1)
0 h& s+ I) {+ f7 l5 K
* \9 e' U( T6 w2 c
& u4 |6 a) d: W/ A( z. ]1 t! r
4 L9 Y# _ V2 ~
用神经网络分类A和B,把参与分类的A和B中的数字看作是组成A和B的粒子,分类的过程就是让A和B中的粒子互相交换位置,寻找最短移位路径的过程。而熵H与最短移位距离S成正比,迭代次数n与S成反比。
; F, I! g/ y N( ^, t" R7 x
1 P8 u0 S p( }; s$ P$ W7 _0 o
移位规则汇总
0 u0 U: \9 n! E' \
7 e) h& S$ E6 x2 c
移位距离就是等位点数值差的绝对值的和S=Σ|a-b|,如果训练集有多张图片取平均值,如果是多分类问题则移位距离为所有两两组合移位距离的和。
/ T3 R! }. n3 v' P- \
% x- o6 F- J$ `- P0 c& `4 b
如对一组3*3的矩阵
( p& R) f) q, z$ R0 |! _
) x1 C: I0 ?; n; t& ]' W
% _1 Z4 t/ Y6 T! r; a
- x& p/ z# V' b
S=s0+s1+,…,+s8=|a0-b0|+|a1-b1|+,…,+|a8-b8|
0 x. o4 P1 k- o0 C( v0 t
- ]- f. S2 j1 K8 V# c
如果是3分类问题,就应该实现3个形态之间的两两分类,也就是要完成3对等位点之间的差。
$ r# |& A. [5 T0 c* ~6 I
" m+ ?: `& A( T3 o. u
% ]4 A$ v; [4 t( c/ ], W# A; j- z
/ Q) o2 a) T9 A- {
因此移位距离
$ d& e/ O- g* K6 Q9 s# E4 Y" b' M( M
0 l, o- B8 U2 I, F' u0 ]
S=Sab+Sac+Sbc=
) |8 {, @9 M3 v6 o! N
7 Q1 O1 S& H3 R8 j) T) c3 u
|a0-b0|+|a1-b1|+|a2-b2|+|a3-b3|+
- Q7 k2 Z: X- B7 l2 N
0 c* f1 H A1 d% ]2 [
|a0-c0|+|a1-c1|+|a2-c2|+|a3-c3|+
* f, [$ V. T7 B
5 ~4 l% K* _+ W
|b0-c0|+|b1-c1|+|b2-c2|+|b3-c3|
; R4 B' I; s1 Q$ t* p! |- @, V8 M
————————————————
6 P% @4 M2 ]. | ]1 G2 s) E4 a
版权声明:本文为CSDN博主「黑榆」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
0 a P. {' C* C
原文链接:https://blog.csdn.net/georgesale/article/details/126690670
% z7 k U$ w2 o) g5 ^
! F& N5 Z! F1 Y0 x6 ~: V
7 n% f% \1 N" \8 K: l
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5