QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3000|回复: 0
打印 上一主题 下一主题

[其他资源] 极限多标签分类-评价指标

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2022-9-12 18:42 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta

    + |! ]3 k& }, e$ _  ^. m1 Q极限多标签分类-评价指标& s6 ]: ~' e" m4 D8 v+ n

    # b" x, s, Q: J) k( k. x极限多标签分类-评价指标
    ) P6 A; n8 [; q4 t5 NReferences:
      N% _6 X4 N# n3 thttp://manikvarma.org/downloads/XC/XMLRepository.html
    . V  M7 a* m$ v0 j7 y3 t5 {* W& R' q" nhttps://blog.csdn.net/minfanphd/article/details/126737848?spm=1001.2014.3001.5502
    - v! ?3 Y: O# X- v, \https://en.wikipedia.org/wiki/Discounted_cumulative_gain
    ( R( U# i' I4 c7 W" L$ n6 d4 H, ?# Y4 }1 [
    什么是极限多标签分类 (eXtreme multi-label Classification (XC))?
    4 k4 u2 w; [) U' \0 m  N4 ~3 C标签数非常多(Million),典型的就是BoW数据标签。& c9 k* q, O% e' h* E6 x
    极限多标签分类的典型应用:Image Caption(头大)。不过在Image Caption里面,Word之间存在序关系。XC可以看成是Image Caption的一个关键阶段,它能够选出与当前Image最相关的BoW。' U. e! q: Y3 s6 o4 B! ^
    (上述都是靠过往经验吹的,近期没调研)。# x4 K9 N, I1 Y% l$ B
      Z; t4 [- N* \+ {) u- @
    先来看一下评价指标:
    ! q# O3 D' f: Q2 ~% v5 q由于标签数非常多,且GroundTruth又非常小,因此通常意义上的分类精度、召回(多标签分类用macro或者micro的acc或者recall)等指标不work。
    ' J# T: S# s+ a这些评价指标通常考虑了head/tail labels,也就是高频标签和低频标签;以及reciprocal pairs(互惠对)去除?
    5 t( r( X2 P; f) O互惠对似乎?是指彼此相关的标签对,比如针对一个数据点,如果预测了标签A,如果标签B和A相关,那可以自然预测B。3 p! o& C3 C; q# a. J
    为了避免这种trival prediction, reciprocal pairs应该被去除。% _: s# t4 t0 ~$ n2 r; L
    ! X- a2 \5 z7 ?3 a& _) S
    (1) Top-k kk Performance:
    " f1 l+ B! P1 N' w# k(Precision@ k ) P @ k : = 1 k ∑ l ∈ rank k ( y ^ ) y l \text{(Precision@$k$)}\text{P}@k := \frac{1}{k}\sum_{l \in \text{rank}_k (\hat{\mathbf{y}})} \mathbf{y}_l
    7 W- B1 p% w. n" `7 h$ E( y(Precision@k)P@k:= $ P: t# U* \9 H- z, Z
    k! N, Z# z: o1 k" I
    1# s0 O: _8 j3 j, ?  r
    0 N2 A$ Q. K! M  F7 T
    / T8 @4 A0 V- n2 @1 {
    l∈rank - I* u0 g9 G+ A
    k6 D1 V( y/ h3 s9 z4 a- _
    8 z. w+ `& r, a8 \! p
    (
    4 v& K& _6 }4 M/ H; Iy
    - ]: i2 a4 q# K2 S' y) T^
    0 `4 s$ h) V4 k1 G" w
    3 r9 W1 ^) p# d' W# Z0 M. M3 U0 D )
    : L- f& F4 A5 W; C' q
    / z3 ?8 l) i# N" k. N; a  _9 H" R, ?# ^! b" H7 Y
    y " Y- v3 N1 y' ~* }2 {7 Y& l4 ^5 C
    l. v$ }$ h% L6 m1 g2 J% c3 |- v' \
    : |2 r2 ?' Y% `' c$ ]% Y6 G

    2 y/ p* Z$ S1 L- ~1 ^" E, m, t' m9 N0 ?& Y+ s& C. e; g7 r
    (Discounted Cumulative Gain (贴现累积收益))DCG @ k : = ∑ l ∈ rank k ( y ^ ) y l log ⁡ ( l + 1 ) \text{(Discounted Cumulative Gain (贴现累积收益))} \text{DCG}@k := \sum_{l \in \text{rank}_k(\hat{\mathbf{y}})} \frac{\mathbf{y}_l}{\log(l+1)}/ m& C4 k2 W, [
    (Discounted Cumulative Gain (贴现累积收益))DCG@k:= 0 [/ o$ ]5 m/ D" c
    l∈rank 5 A6 l( \- k9 [8 B
    k! A0 H8 ~7 O- I3 `" o

    2 ~* \- N* |8 w2 V; { ( 8 M& ]; E- {% p& [# V- Y& H
    y8 h* Q! q1 a$ K, k
    ^
    1 F8 ~+ z% ?3 S/ a
    ) L5 X# J' D3 g% a. h8 Z )) X7 R& u& ?/ o4 o6 L

    ' @$ s- D6 p" [3 q' \& b, l8 @" ~

    5 D) t5 a! N4 R2 {$ {1 O+ }  {; h6 }log(l+1)$ s+ V8 F3 A6 j- @% a
    y
    ) n5 H- f( y) T1 u0 G/ }2 Sl' \. }; A2 T/ ~. ~+ T

    - E9 z+ V  x7 M% x; V8 M* R% ]
    + s3 d# U9 j6 \0 ~( q- o
    5 x7 @) g% b$ ~/ d) F9 o8 g2 ]
    + o: f) ^7 R& z9 Z, H
    " n" {" b& y" ]) W(Normalized DCG)nDCG @ k : = DCG@ k ∑ l = 1 min ⁡ ( k , ∣ ∣ y ∣ ∣ 0 ) 1 log ⁡ ( l + 1 ) \text{(Normalized DCG)} \text{nDCG}@k := \frac{\text{DCG@$k$}}{\sum_{l=1}^{\min(k,||\mathbf{y}||_0)} \frac{1}{\log(l+1)}}+ \  g6 f, `* Y- E3 J) b
    (Normalized DCG)nDCG@k:=
    & ?5 Y+ G% T( ^6 P; i. {' N* t9 ^. n9 F5 M, u: t& X) H6 H! C
    l=16 m6 \% o2 f9 _" I8 d" P
    min(k,∣∣y∣∣
    ( R1 o4 z* T2 @" p" ]" S* F- J$ u2 B0
      ~& O" I1 I* c  `5 b0 H/ H$ [# T; c" o. i
    )
    4 i6 w7 e3 h+ W0 t+ p- Y6 g+ O; i( z3 l5 O6 {1 q5 x4 Y

    9 T! q3 A  y/ q& f: w" }3 jlog(l+1)
    # D" `% U0 K% J  K% k, {* I( s* e17 w2 G* U- w/ Z8 v" N

    : j5 O: s2 t5 P$ Z) \$ Q2 g! \# u3 K& c& x
    DCG@k1 Q% j/ O; S# x3 o7 S
    7 W3 z7 d3 }6 Y
    2 l% ?5 B  u- I3 [/ P$ V( q
    . H7 }4 ?0 V6 x
    rank k ( y ) \text{rank}_k(\mathbf{y})rank
    % C/ Z: @! ?; F! J, r4 p) z9 }5 k  lk
    1 E$ Q8 u: H/ L) i; T) n4 L" @7 K, a$ T, ?
    (y)为逆序排列y \mathbf{y}y的前k个下标。Note: DCG公式里的分母实际上不是l,而是from 1 to k.
    1 {) [1 a5 L- Y2 V3 S
    8 A+ w  ]2 D8 C/ D4 V0 c靠后的标签按照对数比例地减小,说白了就是加权。至于为什么用log?两个事实:1. 平滑缩减; 2. Wang等人提供了理论支撑说明了log缩减方式的合理性。The authors show that for every pair of substantially different ranking functions, the nDCG can decide which one is better in a consistent manner. (看不懂,暂时不管)
    $ N' |# J7 e. [4 l& L$ P. i7 s& J% `5 f" y9 J
    (2) Top-k kk Propensity-score:
    : U+ A  f. I4 {
    8 V; |6 f5 I! ~5 R% e有些数据集包含一些频度很高的标签(通常称之为head labels),可以通过简单地重复预测头部标签来实现高的P @ k \text{P}@kP@k。Propensity-score可以检查这种微不足道的行为。( D7 \, R9 W) @' A$ A/ _
    ( Propensity-score Precision )  PSP @ k : = 1 k ∑ l ∈ rank k ( y ^ ) y l p l (\text{Propensity-score Precision}) \text{ PSP}@k := \frac{1}{k} \sum_{l\in \text{rank}_k(\hat{\mathbf{y}})} \frac{\mathbf{y}_l}{p_l}
    8 A& X7 w- h9 i( i(Propensity-score Precision) PSP@k:= & s) B$ W. y% X6 M7 O5 H' d
    k, A( u  i( s0 P$ s" E
    1
    6 V8 I2 j5 N. D* w. R& j. k7 r# ?- e3 w- @
    / ~8 |7 I$ k" N3 q5 a
    l∈rank # T5 U, o8 F1 c$ M6 ?& H: ]7 s
    k" t* B" R4 x2 v/ I8 C

    3 n3 W9 x& R( I7 u ( 3 F- F) ?% k4 A1 c. i4 {, s# z
    y
      E. X( S( U1 V  e5 b+ B) R^+ R' W8 v# i2 y# u
    - m% {/ c, H6 p; A& [: Z5 o1 p4 G
    )2 V  L+ ?2 A9 ^# X( ~
    + l. x& m; O# A$ c

    8 ]# w0 @  d0 j* N' R6 r! E+ b- h3 p
    p
    7 n1 \, d) t0 s9 bl, F/ W; x% ]6 I2 ^. F

    8 C1 _  D' h+ G, w7 ?; l1 @* ]" ?" Y8 y+ O% H7 C( i: k
    y 7 T1 X- Z% J, B, T' P
    l
    8 \0 X5 c$ Z  v2 a) |; @8 X2 o: [) v! b* M  k
    8 m4 a1 p, }, J. z9 Q0 W2 w

    % r+ i( w( S) ^( C
    / b6 a, H- T& }- |; O5 ]6 ]
    ' a2 u( u  P0 {6 `5 hPSDCG @ k : = ∑ l ∈ rank k ( y ^ ) y l p l log ⁡ ( l + 1 ) \text{PSDCG}@k := \sum_{l \in \text{rank}_k(\hat{\mathbf{y}})} \frac{\mathbf{y}_l}{p_l\log(l+1)}6 ]7 V9 ]1 y  ~0 I( O
    PSDCG@k:= 2 I  e, J' F' @+ I, w
    l∈rank
    ! A$ }# D2 ?- F/ zk
    7 j. n9 ]% z6 L' R* r& r
    9 a3 e4 N2 F3 y (
    6 I! L# e' X! F3 s9 j) Ay# h% s% v8 c' l% l
    ^8 v7 }: l* a2 o2 q/ r: ~

    # \. d+ n+ U% E$ a8 Z )
    4 x+ q2 P" S2 T  I0 _" _- O4 e# e  f

    5 F& R6 x' a) r, `, \8 Q* o* J4 c' D- [% ^4 m6 I: @+ ?' z
    p . I! |1 i( Q( g$ x3 L- f
    l
    + b! o$ ^6 D9 ^. U: T( D0 G4 O3 e
    log(l+1)
    7 s& |9 Q/ [) R' K/ K7 Ty
    2 D- [- w0 J+ p: h) U7 xl9 \8 Y  Y; p; ?1 D( e: X

    + p  z9 u0 \2 p* }# r
    ' L1 Q! p  |; h9 b) o9 O9 K
    ( r* F5 G( P4 N7 w* T, p+ `5 i) Z+ i+ }: i- F' X4 i

    6 P6 y- w, q' T% Z% SPSnDCG @ k : = PSDCG@ k ∑ l = 1 k 1 log ⁡ ( l + 1 ) \text{PSnDCG}@k := \frac{\text{PSDCG@$k$}}{\sum_{l=1}^{k} \frac{1}{\log(l+1)}}
    : }7 P/ [8 S5 @9 APSnDCG@k:=
    ) u$ j/ g6 |, E* H! X
    % c& B* L; u1 }7 L  N( h  @l=1/ C( H4 F$ X" f5 n6 ^
    k
      ?. d+ m9 o  }! ^9 v) S% B- x& d# G# u& E
    / c' @( R8 d( o3 E/ I
    log(l+1)0 u$ L7 [# }7 o+ Q- o
    1
    # e/ g+ ?  F3 {- K) a/ I# _* w) h7 x( ]* t& _) M! ~$ ~7 @, u
    4 p0 f' Z* b0 r" {* w8 D
    PSDCG@k& G- ?# m) \! P

    4 r+ Y) w& T/ H: d$ C- u; R
    " X. S' M/ b: }; ~7 C3 |" B& q# q& l, T" M9 b# d' D  N
    其中p l p_lp
    . y. u  y6 u+ Ql2 S, q' s6 i0 |# U8 g
    8 p& r9 {+ g9 F
    为标签l ll的propensity-score,使得这种度量在missing label方面无偏差(unbiased)。
    : t: M) `& j: M" ?6 C2 F9 kPropensity-score强调在tail labels上的表现,而对预测head labels提供微弱的奖励。
    ; w- b; b- t4 n9 u" X. I————————————————
    " \& O/ D! S* ~版权声明:本文为CSDN博主「摆烂的-白兰地」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    ( [6 V# n7 C4 V" o. t  v原文链接:https://blog.csdn.net/wuyanxue/article/details/126805190
    $ S# O1 F+ o* {( L
    ) l* x8 c0 _- \* I/ M% l2 X4 F2 L8 k
    ; c' {9 L& Q4 E) ]* n- H% E0 ?
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-11 04:07 , Processed in 0.266732 second(s), 51 queries .

    回顶部