QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3003|回复: 0
打印 上一主题 下一主题

[其他资源] 极限多标签分类-评价指标

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2022-9-12 18:42 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta

    3 ~( E: r1 k* |极限多标签分类-评价指标
    ! g1 C3 e) \5 R" ~8 s& M/ i" ~
    ! p2 i2 p7 {7 Q+ q# E8 U4 w极限多标签分类-评价指标# c0 r" `1 M" X: s; F) u! m  O
    References:
    ' J5 e0 i9 L  g% W6 q/ g# vhttp://manikvarma.org/downloads/XC/XMLRepository.html# k; [; g& z+ X1 ~- \" ]4 N/ o
    https://blog.csdn.net/minfanphd/article/details/126737848?spm=1001.2014.3001.55028 q; I# l- N- h7 v
    https://en.wikipedia.org/wiki/Discounted_cumulative_gain
    7 N3 e4 F- K% V( `4 k. N  C; k+ J+ n- Q
    什么是极限多标签分类 (eXtreme multi-label Classification (XC))?9 T: p/ m& T# u! P
    标签数非常多(Million),典型的就是BoW数据标签。
      p4 p8 G; t% n$ f. K3 m极限多标签分类的典型应用:Image Caption(头大)。不过在Image Caption里面,Word之间存在序关系。XC可以看成是Image Caption的一个关键阶段,它能够选出与当前Image最相关的BoW。* c9 h1 ?3 I0 q- a
    (上述都是靠过往经验吹的,近期没调研)。
    ! [* a. r0 v' ]8 g" L5 W) O! G
    7 j& j. _' a: p先来看一下评价指标:
    0 O% Y" Z6 ]; g7 V# m* E7 B% q) p由于标签数非常多,且GroundTruth又非常小,因此通常意义上的分类精度、召回(多标签分类用macro或者micro的acc或者recall)等指标不work。
    * C" w+ E! h) }8 E4 Y6 M) |) @: b这些评价指标通常考虑了head/tail labels,也就是高频标签和低频标签;以及reciprocal pairs(互惠对)去除?
    ( p0 Y' I  \5 z6 Q  Q互惠对似乎?是指彼此相关的标签对,比如针对一个数据点,如果预测了标签A,如果标签B和A相关,那可以自然预测B。
    ) Y, q- S7 K: f6 t, j为了避免这种trival prediction, reciprocal pairs应该被去除。+ i+ m9 o  e" k0 P

    ) g, Q2 t( \4 w/ G/ v+ P(1) Top-k kk Performance:
    ) O% K4 N: A' G$ i(Precision@ k ) P @ k : = 1 k ∑ l ∈ rank k ( y ^ ) y l \text{(Precision@$k$)}\text{P}@k := \frac{1}{k}\sum_{l \in \text{rank}_k (\hat{\mathbf{y}})} \mathbf{y}_l: Z! A. p. V9 t1 I
    (Precision@k)P@k:=
    " \5 p4 u7 C" D' M# K3 b7 Ek
    * [) G8 W2 ]8 V6 U# d) b1
      i0 C. s6 a+ B, \" ~+ E* p$ N4 I5 N  A5 R% S0 j1 }: y$ g, F
    + s. I* ]) C" d0 o7 b/ U, X+ O
    l∈rank 3 |9 _) {# y6 l
    k) e6 S5 J+ v) c' I& p/ W0 @0 P
    & J/ L% }: U0 Q, O  ?( z
    (
    5 j* h: H& U- b( ky
    6 L, H1 O  L; M+ A  l6 w1 V^5 I# e* ?- m3 A1 `

    3 U0 X$ j9 _# q; l7 {7 | )" ~3 ?) C0 a5 a+ o
    ! |: Q# z# T# Q2 I
    7 z& E# o$ }- V2 C- E- \. j! W
    y
    1 |5 L$ X6 N' g; F1 vl" Z( W/ [  n; V
    2 {7 m. g* D, p3 W

    # t1 S( D( J4 B9 }; K/ h+ h
    / E' k3 f0 o' X3 {( [(Discounted Cumulative Gain (贴现累积收益))DCG @ k : = ∑ l ∈ rank k ( y ^ ) y l log ⁡ ( l + 1 ) \text{(Discounted Cumulative Gain (贴现累积收益))} \text{DCG}@k := \sum_{l \in \text{rank}_k(\hat{\mathbf{y}})} \frac{\mathbf{y}_l}{\log(l+1)}
    ! K- W9 G2 }1 ?7 C(Discounted Cumulative Gain (贴现累积收益))DCG@k:= $ V2 p. ~+ L) e  P' z. _
    l∈rank 4 K4 B; y% t6 u
    k$ l, o  U# j" O$ k: w, k" m
    0 ?6 Y' _- {$ W
    ( ; I) A, ^8 v! w8 p4 ]- x
    y
    1 P5 E+ b: v; s8 Q# g" Q^
    , N( f% N4 Y# y4 b+ d7 F, Y; s
    5 }5 \7 k) x% f) U& l. ? )
    . d' \3 e9 `5 j" R0 Y( F
      }' T5 d' M& k0 p+ m( k) j) g  m9 H0 u" c, `' A& ^. ^2 {! `9 r5 ]# \
    ; L% f4 Z/ @% t( m" P4 |1 ~% Y
    log(l+1)3 f3 O& c' R1 L
    y ; @* k' c! d- i" [7 h
    l
    2 Y! s  \. w1 D2 y4 j; [- x: R) B# n8 T
    ) h7 M8 T9 A; r2 H8 W$ d

    " s* E4 M( w: `4 Y5 r$ z- X/ m# C
    ) E8 X! |' e8 [4 V
    (Normalized DCG)nDCG @ k : = DCG@ k ∑ l = 1 min ⁡ ( k , ∣ ∣ y ∣ ∣ 0 ) 1 log ⁡ ( l + 1 ) \text{(Normalized DCG)} \text{nDCG}@k := \frac{\text{DCG@$k$}}{\sum_{l=1}^{\min(k,||\mathbf{y}||_0)} \frac{1}{\log(l+1)}}( V# Z2 l+ I. q7 t
    (Normalized DCG)nDCG@k:= # o# W2 Z# D: i; Q* s$ d
    ) d9 m0 R: V# |) P, p( p
    l=1
    8 O( `$ D& x: w, C* g( ]+ Z9 Jmin(k,∣∣y∣∣ 3 m; {% e. k# n+ g
    0* a3 u5 l, Y, v0 e$ b8 X4 L
    , u- i7 _9 `" i; }! y- S4 P7 n# Q+ N
    )) y3 w1 w$ k$ a& w, i; y9 B
    1 w2 f' @# a- c0 |: g1 T% K

    ! B0 R7 l0 d& i0 o3 L( wlog(l+1)
    * D8 {0 M2 \/ o8 H' D7 @1
    # X( X4 L  y2 u4 M1 L
    $ y  E& p: q) Q7 c: B5 @: J# G% W  n) U/ x6 O3 w* G
    DCG@k
    . y$ e; d( y4 T( X! ]0 j- R( x. [) {' Y' _; e) ?+ L( [9 R

    7 c5 K: n% K- K+ N0 m7 B" o' G+ q
    3 `6 r7 H4 Y7 B; B1 ?rank k ( y ) \text{rank}_k(\mathbf{y})rank ! T( G& g! A& {" M! q6 j' [2 b/ r% n
    k
    " `3 d1 h; u2 k6 O/ l* J5 V; H, i6 H& R1 R& L& o; @
    (y)为逆序排列y \mathbf{y}y的前k个下标。Note: DCG公式里的分母实际上不是l,而是from 1 to k.
    : V% j0 [% {# |$ o; N" H
    2 w  a; t3 a8 _- O) Q" _靠后的标签按照对数比例地减小,说白了就是加权。至于为什么用log?两个事实:1. 平滑缩减; 2. Wang等人提供了理论支撑说明了log缩减方式的合理性。The authors show that for every pair of substantially different ranking functions, the nDCG can decide which one is better in a consistent manner. (看不懂,暂时不管)
    - R2 V! C% h: d) q% w4 W% }( |9 p- C3 k$ C, v/ T3 n
    (2) Top-k kk Propensity-score:1 w) [9 j5 C( x  ?

    , o  N: E4 R9 n, g# k有些数据集包含一些频度很高的标签(通常称之为head labels),可以通过简单地重复预测头部标签来实现高的P @ k \text{P}@kP@k。Propensity-score可以检查这种微不足道的行为。
    8 Z, ?3 V; v/ ~! s( Propensity-score Precision )  PSP @ k : = 1 k ∑ l ∈ rank k ( y ^ ) y l p l (\text{Propensity-score Precision}) \text{ PSP}@k := \frac{1}{k} \sum_{l\in \text{rank}_k(\hat{\mathbf{y}})} \frac{\mathbf{y}_l}{p_l}
    8 w; u" F- y- v0 R$ |& h3 |" H0 l(Propensity-score Precision) PSP@k:= % O$ o* R( x( i% q" K1 r) k' W5 X
    k
    " [5 I& p* n6 a- X, y. O1
    1 t7 g! P* O5 i. x
    % q# S  V0 l- n3 u1 Q8 M' S
    0 o. I9 j' N: @/ A! j+ {( }7 [9 Vl∈rank , G' r6 x. I" c1 j
    k% @+ T; O2 b3 q& _. m1 m! |

    5 y* J/ O0 M# ~3 ?8 Q (
    . n/ B5 O. L4 O! {. M6 Ly
    ' N1 B: t& H' G+ z3 ^^
      Z1 H8 r' c( X/ M
    + o5 U3 o4 `6 z# g8 x0 l) a  V )' p& U; ?0 Q; g5 \

    ' I  C" h0 x8 N$ [
    8 T. z* _# B# W! M( P: h  @1 M" L( c- g& r
    p
    2 `' T* h$ W4 C( V9 b4 pl
    % h% f% z, j" _4 ~% g) Q1 a+ s0 g( N+ {! g1 N3 D2 A* n
    # C( T3 k) l$ T8 }4 I
    y
    3 Y- s% c( E  @9 o9 G  jl
    - C3 L- @, Z) a& o  {% u* E6 J' h
    ! ?% s$ m; J9 a, Z5 U/ _6 J- E# ?  ]
    % S9 w& f( S  n8 k; v5 r1 ?, o3 C4 A2 l& \: B
    6 t# `7 i1 O* f, N+ _% @6 ]
    . ^" U" y" n; v0 W) B8 `
    PSDCG @ k : = ∑ l ∈ rank k ( y ^ ) y l p l log ⁡ ( l + 1 ) \text{PSDCG}@k := \sum_{l \in \text{rank}_k(\hat{\mathbf{y}})} \frac{\mathbf{y}_l}{p_l\log(l+1)}& I6 A. ^! b, p$ r; ^
    PSDCG@k:= - d* j5 I/ j0 k3 n! d& [- B
    l∈rank
    * [9 V2 d4 a9 W" `3 `) H7 hk% {( ~. `! ?4 a1 B' d9 x# Q
    ) a- s! u! f* a$ s3 v- v
    (
    2 S4 ~0 ]0 |* [" m+ j" n) k/ cy3 y' V3 S/ z' R+ \, s- o# N
    ^
    : ?: \4 X& ?! w7 P  J1 k; m9 _, O+ t* l) T2 i
    )
    ( \1 f, x/ \0 V
    , `: z+ o. U# H' c% z' P6 h! I2 D: V+ ?8 f5 F

    ; W3 N6 C+ ]- l& [p 5 e& ~/ `7 ~: ]% q( }0 a- ?
    l) p" x; m. K6 g0 T. R" x
    6 Q2 U! A1 |, I6 X1 M. I2 h* \
    log(l+1)
    ; h" a& h/ K1 X8 ]8 f) _+ \y + A8 B; |" s) ?* w$ b6 M) l
    l
    . e! f4 n9 S# U3 n6 Z% F$ I4 y
      t6 J6 ~- Q4 h0 Q2 O1 B6 x* o2 d; t5 ?8 P6 F  {. {' f* |  L

    / Z5 l1 ^$ {5 f; p3 e  t4 U7 T* z& N3 C. E1 Q# Y
    . @% Z" x. S) l: g9 i
    PSnDCG @ k : = PSDCG@ k ∑ l = 1 k 1 log ⁡ ( l + 1 ) \text{PSnDCG}@k := \frac{\text{PSDCG@$k$}}{\sum_{l=1}^{k} \frac{1}{\log(l+1)}}$ z% t5 X: P1 Y  g7 f
    PSnDCG@k:=
    : d" W( e  \6 M, V4 b; d9 b- }& i1 A) t0 j$ S
    l=1
    " p# S2 K* O$ @k
    : N3 C  N' H0 p% _! A: v0 I7 i
    % b6 j* |, T1 N& Y# }: E4 s
    3 d) I# ]! I9 l0 ?( f) B  o2 P; Slog(l+1)0 A7 u$ G* q7 V3 Q! B9 s& _: o3 {9 ~
    1; o% B7 H4 W0 t$ o
    " R6 o, F1 z( B
    , ^9 m% u! L2 u0 z; e& o: E
    PSDCG@k$ v' q/ u4 i, R. @  j9 t' s
    1 b8 F8 h- Q2 |

      g& l/ N) G  T0 `9 z6 k! @. i5 T% K3 f
    其中p l p_lp
    7 s) {8 u7 X2 v+ ?' Y/ F6 ol
    ' h# s0 t) Y( `5 d( z  q# v8 O) V* Z* `4 Z* k
    为标签l ll的propensity-score,使得这种度量在missing label方面无偏差(unbiased)。
    - F8 T: Y, }8 q) _Propensity-score强调在tail labels上的表现,而对预测head labels提供微弱的奖励。
    + d% o+ H+ u3 B————————————————
    ! q+ {# r+ @+ A4 S版权声明:本文为CSDN博主「摆烂的-白兰地」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    ; A5 M- c/ v$ R7 i7 Z原文链接:https://blog.csdn.net/wuyanxue/article/details/1268051906 @, u- _! z9 c" g, y
    $ R7 l0 d8 F2 q
    $ j0 b! A8 H5 J5 ?$ X
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-13 07:30 , Processed in 0.570919 second(s), 50 queries .

    回顶部