QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2134|回复: 0
打印 上一主题 下一主题

[其他资源] 三分类网络的物理意义是什么?

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2022-9-5 16:00 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    三分类网络的物理意义是什么?
    * S$ ^5 p: e+ F; O$ v8 N( a/ R! a3 b& T. T
    用分类实现衰变- Q, I9 ~3 v: K; y* ?
    专栏收录该内容
    ; X2 i2 ]; |5 w; N0 d52 篇文章0 订阅
    " c3 k8 S, A" L- E订阅专栏
    - N6 D  v$ M6 k9 N2 w' \5 v(A,B)---m*n*k---(1,0)(0,1)$ X9 w) X) @- Y9 e5 m
    : i0 V) R4 O" E
    对于一个二分类网络可以将被分类的A和B分别理解为粒子和环境,因为粒子处于环境中。于是A和B之间的距离可以理解为0。因为t=s/v,则即便A和B之间的相互作用的速度小于光速,A和B之间仍然可以实现瞬时作用,并不违反理论。6 J* G- W- _7 P+ J

    , w& r; V+ G8 P, A3 |% i$ `( A, B, C )---m*n*k---( 1, 0, 0 )( 0, 1, 0 )( 0, 0, 1 )( }1 b, p. |+ v: d# d3 S* ?

    # a+ }% Y% r4 i# t0 F对于一个三分类网络要完成3次形态的变换。A⇋B,A⇋C,B⇋C,每一次形态变换就是一次二分类,因此对于一个三分类网络可以理解为由3个二分类网络组成
    ( T5 v0 M, t; K* H$ g# G  k- P9 f" x6 ~" l2 q2 q
    (A,B)---m*n*k---(1,0)(0,1)
    * d. Q* i7 M+ A& J( ?! o
    8 J: ?5 h; F) R(A,C)---m*n*k---(1,0)(0,1)7 Y5 ]- s1 l5 J& c
      y0 G) x  }% [' n5 f: j
    (B,C)---m*n*k---(1,0)(0,1)9 T8 |$ h- c1 K( p
    . n. h+ l1 A* K7 |8 E
    这就意味着存在3对瞬时作用,也就表明这3个粒子彼此之间的距离都是0.随着时间的推移网络的收敛误差会不断减小,而网络的分类准确率会不断变大。这个过程意味着A被错误的分成B和C的成分少了,同样B被错误的分成A和C,C被错误的分成A和B的成分也少了。9 C% Z5 t+ A6 e$ @

    ! L; Q! j' M9 r5 Q所以这个三分网络可以被解释为,3个距离为0的粒子不断的相互作用,随着时间的演化,最终变得越来越像自己。
    " n# n4 t0 p2 X0 g2 U7 X% V  z
    ; h- {) J; d& Y; ?! {$ x而前面的实验表明相同收敛误差下,迭代次数取决于等位点差的绝对值的和,这次就继续验证这一猜测。+ x- K/ g/ Z/ x5 q# Y
    3 r! q6 p* Z6 V$ R! H
    用的训练集是mnist的0,1,2,3,4,的第一张图片。用间隔取点的办法化成13*13.0 ^9 n% j( C2 Z7 Q
    0 z7 P4 T; C8 t3 _- h
    ( 0, 1, 2 )---169*30*3---( 1, 0, 0 )( 0, 1, 0 )( 0, 0, 1 )这个网络简记为0*1*2.就只有3张图片不断循环往复,直到收敛。共进行了10组得到数据1 R( |: r  q& x' r& y1 {
    : t3 M$ d5 w9 E  ~8 C$ B+ H
    1*3*4
    2 a2 t" B5 e% @' ^
    ! k: _( V. U9 i: Q% A7 X$ D  N2*3*4% W$ A2 C6 ^' d. m( H2 Z1 h

    6 U8 g4 j( W+ q. E0*3*4% h% V" I& B. a. v. h( @  E

    3 E; r8 T2 v) E- y# E% S0*1*4
    / L% }) s& Q" {2 u0 ]# t" @" p% e7 n* E$ H3 @/ {0 |2 i) H
    0*1*38 H% W, W' g3 b3 [5 y
    ( a; Z: J" v/ n
    1*2*4  |/ }# D7 `, `6 M

    " j) p! R+ r6 B5 r0 Y) F1 j/ m2 t1*2*3
    5 _( I1 c4 y; F: T+ |; c3 u% H8 t  k
    / c6 u6 A0 I6 W2 Y0*1*2; C* X- ?+ W) Z7 Q* p$ W
    9 V) a% L! w/ J. W& o
    0*2*3( N) v, E# P% N/ V! ~
    6 |+ S4 Z3 x' A, `, c0 r; ?* K
    0*2*4
    ; I0 O4 C, }  _4 Q  ~" l/ ~
    ) p9 y: G. T! U; Y9 yδ
    ( e4 P$ F0 R3 r8 I
    5 O- v5 I- `/ W# w6 t, Y迭代次数n
    6 j6 T5 z; L: p* R) o
    1 s& N, u! K7 N' I' r迭代次数n
    2 P' x; k2 K. t. {: n
    2 d& B& \. G, H4 o7 |9 N迭代次数n
    7 R9 H' p7 a+ `- U, O6 L" L7 L' ~6 S6 z7 [3 R8 I6 y
    迭代次数n
    " P( M( S  V6 P5 S* f4 U6 s/ m1 g
    5 G; s4 b/ K: r; A+ \- k* `迭代次数n; a9 T" R* O! a
    & |  {/ b" j& L  ?& e
    迭代次数n$ n5 |' {1 _/ V) O, V! h
    4 n5 H; F( ~, Z; \+ e. m) c  L
    迭代次数n8 s, u" F* k0 G. Y1 o3 v5 n
    : ^( ~0 X1 \: @9 o7 _
    迭代次数n
    $ J( ^3 M* \, K' C, d& H  ~" o3 K- I5 n
    迭代次数n8 c7 ]$ l, U+ o- e( c/ m  v- `
    5 l" J( G# j9 V) B
    迭代次数n$ j! s. l2 ^. }7 M5 M3 v* I9 d; U
    5 a) {2 F9 g' i; X( ^; \/ z
    0.01
    9 l9 K) L9 R1 D/ @; E
    + R1 f$ J7 d+ a# I1763.1809. X0 Q5 _% l2 s6 ~

    $ D- `6 L0 H0 c4 }; R1626.5729
    + g- U7 v+ F+ W/ N9 A1 n, r" m; z8 N
    3 ^7 B! M5 L* i5 J4 j; {0 D% Z1672.4523
    # E# g0 y9 T3 M1 u+ w1 `; r7 z0 O9 X7 |  d' f8 m1 c. ]1 _
    1635.9196% {% m" G' x4 H4 @4 ~
    & f* [# E2 ]9 A  ^
    1596.70358 G) S# R' |! i/ z. o
    ) _! x% r1 \6 e# O4 {5 I2 i
    1620.407
    1 \  v+ l6 B1 F/ l8 W% U5 K% T2 O: b6 L/ ]
    1563.89450 x# S2 T0 k- ]* Q6 F1 a

      g' H0 W9 f, S, R  ^1444.2915
    * e/ `* g- v" Z( Z5 l
    - j5 y5 D% G1 @0 L1410.0302
    7 b- s) _$ Z8 k8 i% L- Q% U9 |( a+ Q6 K; U0 r
    1465.4171
    2 W% w/ Y/ ?) D4 Z( C2 E$ w6 q! m& Y# o5 {  B) f& W. M/ W
    0.001! S5 v3 M( t+ |8 ?& D

    " `" G' f5 W( c. T13065.196
    + O) ?5 n& B: X; ^' C0 F: J( a4 D& t& x4 K; b  V! m
    12674.945- H" h- U* z2 |: d1 B( F

    # ]. W' g' Z. g+ ?- ?! I" |( P+ G12747.729
    4 T: I# P) R  `
    5 s: S& m7 W3 ]12386.216+ r0 ?# K7 J3 R$ z- n# ]5 l
      z* h  U' O6 l8 i1 ]
    12349.02
    " Q' y9 V, W# s9 {
      M; k3 B: T! m  J! U# c12282.2016 g: x( _3 n! f2 U9 y- I
    / p, o! F6 x# l
    12270.035. D& |/ h/ Q' z" \7 P" z- _! z

    ( f  S4 T9 P) q; i6 F11338.477
    8 G' c# M9 r5 O/ }- ~2 a
    5 t6 F. E( V% H% N* e10985.201, F2 q4 D9 S% y# g/ D
    ! i. o9 f- K" _8 Y% m
    11015.5035 h6 \4 N* I* @4 G( C0 z

    9 g/ K/ h; l, h' }3 s7 D9.00E-04
    / m$ ~; @1 R; x* K3 F9 L% K' t4 ^! s& T
    14352.452
    0 x% E  l7 e; r3 h! a, s' @
    1 _2 _  Y3 `9 C: Q" T# _14004.633
    ( Y' h6 v% x: b0 J# U* M
    2 h$ E) \5 N% v& x; j' G14062.829
    ! O7 e. Q5 r2 C7 Q6 T6 q% G3 s0 W/ \8 h" E8 P
    13629.467
    0 \2 x3 P! R5 M: m7 u  F$ Q! S. H% k: v" w9 T0 \6 X9 S
    13613.362
    ! ]( [7 p1 T" p" n2 j: B! C
    0 `: @& ]8 D0 S9 B& k6 ^13609.563$ p6 D: {) y' W# j1 k# G7 G

    . F2 X& U. Z* n; G0 _0 E- |% R" C13530.322
    0 e: F: R4 D) n! n: f8 m3 j2 E7 ^# U. T" u0 `
    12458.171
    # j! b( J, l% r4 z' `0 P7 j2 g9 ]
    % Y; l1 ?7 v# N8 l4 ^" d: E+ ^: B12176.362/ ~. k5 Z5 J. N
    / B& N. j4 L. T/ g. Z& n& f
    12225.96, d2 e; k  C7 U* V: v. a

    : t/ V! ?3 K) T8 m8 h3 U" [8.00E-04* s' s4 }% N0 H% n3 f
    # ?& x1 C& |" w: R
    16141.2069 \+ e, [1 }0 s9 y
    ( l) M: f" ?/ q# x6 Z
    15611.101& Y, d, d- [( O, U) J: O3 v- N

    ' S8 n9 m8 ~- q3 f0 {15749.91
    6 S' }( q$ N1 w3 ]9 M3 F4 [5 z2 V' A: p8 i9 N
    15264.981 N; g: N: b# j- k7 \! `2 x/ H, q

    ! ]  ?$ C% ^/ M. V15228.447  T0 j: O" j, l6 X" j
    * @3 G, U4 u- f- m
    15207.628' Z6 O8 L! ?% U% c$ G

    ! c) l: S# F1 v4 F15053.714
    ( v1 ?- z7 F) s0 L1 L' Y
    0 N7 Z, L! z# ^6 E1 T8 c14044.729* \+ y6 @' p6 B% k# G. S$ x/ w
    ; i" ~5 B& y( D5 P& U" v$ d7 A; Q
    13530.397# d& `! W2 w9 c; Z

    : U2 j) l+ z+ ?13654.678: E8 ]' ]# j6 M; u/ H# K  S- X
    : i$ ?7 w, |% Q0 d3 w# r1 o& @
    7.00E-04
      D, V' ?. f; T3 E7 c. ?& O
    ( e) _# `# m% @4 f18194.397
    1 ?; B4 ?9 E' |2 p! e  f3 r
    0 Y: e/ h# q; g3 t17760.638# a9 n0 y2 V- y3 I& \3 Y
    % ]5 U9 u- u& a
    17743.578
    / J2 G7 |0 h* X+ t
    ! w7 r. R/ y8 m17333.377
    9 i( D9 F* a  h) d! [" e3 e" v+ j- W0 Q: ]" a. c
    17293.8746 w, C3 o; L0 @. w

    ) i8 O/ c2 M  o17204.638" G! b: e: V* b  u$ g
    % w) G1 F6 a3 ?* k, x) W% e. o7 W5 |
    17058.8090 W0 G% g- ~# I9 ]

    ; x3 g- y1 f- [" r15946.101& u6 c5 S/ A: N9 d1 B
    : C0 m  d' P" |
    15491.266/ w% E# `7 @& m( a
    # X3 w5 E4 L+ h( W
    15399.538) v7 |% S7 n0 J* v# I

    " `, ]5 F  S4 Z& @  ~+ Q$ E2 S# es
    & p" s. |0 @  X/ y8 c$ d3 `8 J8 N# X% W9 J; b; D
    130- D" b: T& k4 i: u' m
    ) g5 @9 q, s# a2 _: ]4 r9 \6 z3 F
    218/ ~* h, x8 C7 ]$ i

    / o7 T# s) S- a+ I" ^$ k198) u9 P' T6 X4 o0 v; D, R
    7 T) E1 n" K/ N' f& [1 n
    206. Y6 y: O) A; Y' a, b1 N$ n

    + D$ f! ]2 W3 n) P. m204
    % w! M& E  }; Q7 p# K
    " j; ~# s: @: g! v218
    & D/ M; d+ Q5 l/ ?3 K+ O+ y- b7 v+ x+ I
    220! P3 \) |5 `$ v7 {/ u5 v+ W

    : n9 }9 T* i( G" |0 R: x& o204
    6 M- M  [  T: m, P/ N3 B! t1 i* \0 L2 G6 X
    220
    + j  O1 f% {. l( H# B" [; [( I  n1 s+ J; }9 ^0 P
    216. q1 j4 _* V9 `' S. q4 L5 q
    2 c5 a& w& o2 ?: y2 d
    将收敛误差为7e-4的迭代次数画成图; t" n# Q. o- ], d. c4 `
    , K; p2 o  O/ {5 r* V! n+ t

    & l( Y" `# K+ a3 s7 f8 l5 g4 D
    5 o6 w+ h1 M- S+ F1 J7 [再将移位距离S的曲线画成图4 A. M9 g+ ~' k* r3 ~
    ( c. z  p5 ?) R* L, H

    0 g0 Q. C& L: k" }! @1 l0 L  D2 |* H  u) n: J, {* p
    在这组数据中s和n之间的反比关系依然存在。5 {/ }3 o2 R/ b1 c0 t2 y

    $ T5 @  \  Q0 Q9 i( X. B& P移位距离假设
    ' V) F' x) [( h4 Y
    % g- S6 ^4 h% j- ~- ^8 O(A,B)---m*n*k---(1,0)(0,1)
    6 p7 d  y) r, s# h) s6 ]* {2 u0 O4 _' T) C" v3 Q2 G9 f) o
    . O# ^6 U2 G5 a7 G0 [) ^1 A. R# Q

    $ z, N6 v# k5 v$ o  M% Y2 y用神经网络分类A和B,把参与分类的A和B中的数字看作是组成A和B的粒子,分类的过程就是让A和B中的粒子互相交换位置,寻找最短移位路径的过程。而熵H与最短移位距离S成正比,迭代次数n与S成反比。7 W! s" C  b# x* u# Z$ y

    7 Q! s! l) {# G' |移位规则汇总* }# S3 B9 \7 u& X1 K3 r# K

    / ~# d* q+ s, J$ I% L移位距离就是等位点数值差的绝对值的和S=Σ|a-b|,如果训练集有多张图片取平均值,如果是多分类问题则移位距离为所有两两组合移位距离的和。
    ; t" j4 G4 H( _- ?0 |* ]- }' u" m, l6 v! w2 ?
    如对一组3*3的矩阵- y7 Q7 @; g( i; y

    , K; Z3 o/ u& h+ y; k# J
    8 e4 l% A% A' ~. G7 ~9 z
    ' w3 ?( X& ?2 L8 }! n" ES=s0+s1+,…,+s8=|a0-b0|+|a1-b1|+,…,+|a8-b8|: e8 r/ @( s$ P% m5 `( m
    $ i! [0 a) c) D# V1 @2 ^
    如果是3分类问题,就应该实现3个形态之间的两两分类,也就是要完成3对等位点之间的差。, a# H2 H2 E/ t; u) Z: X% q9 B

    5 {' t' n7 k' G* V1 g6 |) l, {0 r; T. H7 @$ C1 O: R

    1 {/ I; X2 O) m/ b; x7 I因此移位距离
    : H8 }2 z' s; n4 b6 C* ]7 x0 J. T* N1 t6 X) b0 h$ X8 }; D
    S=Sab+Sac+Sbc=3 ^. e( m3 D) e* O
    6 r8 _% l. |, u! X4 v5 @
    |a0-b0|+|a1-b1|+|a2-b2|+|a3-b3|+' l9 r; Q" h: r/ r5 }" d) R
    ; Q1 E  \2 X! R& Q% W/ [
    |a0-c0|+|a1-c1|+|a2-c2|+|a3-c3|+8 b6 @: N* ]9 w7 ^2 g

    ' F, n. d1 R% P  R- h|b0-c0|+|b1-c1|+|b2-c2|+|b3-c3|
    5 A4 k7 A( I$ A$ l————————————————
    % v  j8 ]" @6 x7 k3 v' @" [' D2 W版权声明:本文为CSDN博主「黑榆」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    + u0 d2 c7 W" l* I9 [9 R5 |原文链接:https://blog.csdn.net/georgesale/article/details/126690670& D2 Q9 t! x: D1 c) z! P( ]# |

    3 d& g& v4 l( ]% w0 ^
    / f# P% z( Z: B# w; X
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-8-18 06:10 , Processed in 0.372768 second(s), 50 queries .

    回顶部