QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2969|回复: 0
打印 上一主题 下一主题

[其他资源] 极限多标签分类-评价指标

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2022-9-12 18:42 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta

    ! m# p2 e, D" ^0 E7 I/ q极限多标签分类-评价指标
    . r. L2 j0 m. P) S0 }
    & ~  q2 G# W3 A2 s极限多标签分类-评价指标5 J. \8 P. J& _$ @  T- n  F: x9 l: l
    References:9 h; U  I% O+ u: |; n1 j5 n7 i9 Z
    http://manikvarma.org/downloads/XC/XMLRepository.html
    ! |  y+ ?4 B* S9 Ohttps://blog.csdn.net/minfanphd/article/details/126737848?spm=1001.2014.3001.5502
    9 ]5 B6 d4 `" z; Vhttps://en.wikipedia.org/wiki/Discounted_cumulative_gain
    & q1 S2 E  }# |' `; t$ {; {4 C/ a" q
    什么是极限多标签分类 (eXtreme multi-label Classification (XC))?& t; @" d2 D- r( w; u
    标签数非常多(Million),典型的就是BoW数据标签。
    ; g: N: q6 y5 i: m$ e极限多标签分类的典型应用:Image Caption(头大)。不过在Image Caption里面,Word之间存在序关系。XC可以看成是Image Caption的一个关键阶段,它能够选出与当前Image最相关的BoW。! t0 k0 f4 K* k" ]
    (上述都是靠过往经验吹的,近期没调研)。
    # |6 Q+ p/ K" ]6 _* \1 q9 i- e1 u- X& C9 i. X$ g8 J
    先来看一下评价指标:
    ( c* f7 J1 H! k" w; f) q由于标签数非常多,且GroundTruth又非常小,因此通常意义上的分类精度、召回(多标签分类用macro或者micro的acc或者recall)等指标不work。
    " U$ l  X* L5 I. `: V8 q- I这些评价指标通常考虑了head/tail labels,也就是高频标签和低频标签;以及reciprocal pairs(互惠对)去除?4 Y) }/ V$ V" e5 o* W# _
    互惠对似乎?是指彼此相关的标签对,比如针对一个数据点,如果预测了标签A,如果标签B和A相关,那可以自然预测B。
    + v5 N# ^8 t+ }9 y" W9 A3 f/ o为了避免这种trival prediction, reciprocal pairs应该被去除。
    ' v8 F& ]) m# h! B  O
    ! y# `9 n( e+ c' u, Y(1) Top-k kk Performance:( S& L( R' }* |8 [$ m7 C* z; u
    (Precision@ k ) P @ k : = 1 k ∑ l ∈ rank k ( y ^ ) y l \text{(Precision@$k$)}\text{P}@k := \frac{1}{k}\sum_{l \in \text{rank}_k (\hat{\mathbf{y}})} \mathbf{y}_l
    + Z* y5 L6 N, t(Precision@k)P@k:=
    % b( i( J" J, n" ]- vk0 p4 `/ [0 L' W8 q8 E2 W& A
    1
    9 D8 ^+ {; _1 C; Z/ c
    ; T- q8 v0 j- a* |7 [7 e( f/ M0 c) ?8 i1 r$ C. K  W2 c
    l∈rank
    : M* {1 P$ N3 ~2 k, pk
    $ o6 X9 U! {( u, R) L
    ) v7 `4 T3 _- D8 } ( + G/ _+ k" S& B$ ^% E6 b
    y
    4 N2 c+ _* F" ^: K, s: K^: R% @4 v9 l; `; H
    9 A& ?/ [+ s! ]- [4 q8 O/ t1 i
    )4 W: {( ~/ Y* l7 a% `

    , d& p- {9 Y! O: |/ k
    2 R6 K& ^3 ?9 I& W$ M8 V0 ?4 P; s y
    4 i* N9 x) T2 C6 V0 p) C) wl
    / \* u8 z% d% H# i) y( z& h! w
    . h3 A8 P+ |! X3 v) P
    6 `$ o1 G4 ~8 u5 M$ M3 x' ?! P. Y0 n; s- S# U
    (Discounted Cumulative Gain (贴现累积收益))DCG @ k : = ∑ l ∈ rank k ( y ^ ) y l log ⁡ ( l + 1 ) \text{(Discounted Cumulative Gain (贴现累积收益))} \text{DCG}@k := \sum_{l \in \text{rank}_k(\hat{\mathbf{y}})} \frac{\mathbf{y}_l}{\log(l+1)}8 f" L7 u  S& |) c  K! {7 f
    (Discounted Cumulative Gain (贴现累积收益))DCG@k:=
    . V' m7 l: {! y: F4 Z0 q: w- fl∈rank , u  }$ ~, w0 r9 z& h; e3 [
    k
    8 ]$ x+ R3 \* L/ e7 Y
    4 M$ ?4 k% \: k: g6 U; ^& I ( # ]3 a7 z% p0 N# L& H( i
    y3 l+ \0 Q9 y" L4 o: t- l9 R
    ^$ e. `1 b1 D8 }' b
    - {  p, `1 U0 L) s: c
    )1 h7 ]' c; A3 L' [; X/ ?

    ' S5 z( O" i/ o% F5 e7 C/ v1 x+ {, ^+ u& F

    , i) s2 K) y9 D9 T  clog(l+1). B: _5 W( c2 h2 b# F/ W0 O2 S& Z7 T
    y
    ) w! U% C& R, h0 |. a; d6 Ql
    / i; c, |6 W, M. g% l' F/ U3 K2 n5 p6 U- m' |' w2 q6 P
    ' w, `, _! }7 [8 ~2 ~: N

    6 w: F2 q0 w2 h& ^+ U4 E. e1 Y
    % N# v6 {3 i8 ~7 u) Z" u. c7 C0 M0 o5 N* j+ F# X: K6 O* ^
    (Normalized DCG)nDCG @ k : = DCG@ k ∑ l = 1 min ⁡ ( k , ∣ ∣ y ∣ ∣ 0 ) 1 log ⁡ ( l + 1 ) \text{(Normalized DCG)} \text{nDCG}@k := \frac{\text{DCG@$k$}}{\sum_{l=1}^{\min(k,||\mathbf{y}||_0)} \frac{1}{\log(l+1)}}4 X8 H9 |5 o6 t' b9 M3 x
    (Normalized DCG)nDCG@k:=
    2 G, H. N5 G- q! J8 ^- O
    5 S, n6 ?% u& p6 @& P: B5 a6 Dl=1" H; i0 w, y  L  c0 q+ [4 `
    min(k,∣∣y∣∣
    8 k8 q2 B2 Z$ i9 }0 Y0, ]. `) J+ f- r9 \5 v, M3 z4 Z

    / r9 W/ D5 F, V' W. |; W )
    " p% C1 `0 V( h4 e$ P! @7 w( d, s3 p9 n- b, r. R
    6 d4 c" z! W8 M3 r
    log(l+1)& u3 |* i. E; K2 l0 R
    1
    # s* ?- g: F  [7 w
    * ?7 i6 q4 L, ?1 o0 x  M# _! Y# N/ b
    DCG@k1 D! z) r# T, s$ s
    2 ?7 h2 k7 e6 _2 ^$ [+ x
    3 a+ _# X5 s4 G  M

    4 K6 r+ D9 |, |1 @0 {7 o. Irank k ( y ) \text{rank}_k(\mathbf{y})rank
    2 {  N4 O1 B' a, h: pk2 f1 A0 n- v( ^. N7 l6 q

    9 c+ G# H/ u; c' d (y)为逆序排列y \mathbf{y}y的前k个下标。Note: DCG公式里的分母实际上不是l,而是from 1 to k.
    " ^5 ]5 H- \8 f/ [9 }( U, m* \0 P9 g8 T+ k/ u5 k7 H/ O# N
    靠后的标签按照对数比例地减小,说白了就是加权。至于为什么用log?两个事实:1. 平滑缩减; 2. Wang等人提供了理论支撑说明了log缩减方式的合理性。The authors show that for every pair of substantially different ranking functions, the nDCG can decide which one is better in a consistent manner. (看不懂,暂时不管)
    6 \* P% G9 I1 ?( `% `5 o! C6 {
    % J1 S$ a/ O# X1 A(2) Top-k kk Propensity-score:3 b- J& `( i" B2 m9 w# l# j

    7 ]3 O5 ^5 e9 ]有些数据集包含一些频度很高的标签(通常称之为head labels),可以通过简单地重复预测头部标签来实现高的P @ k \text{P}@kP@k。Propensity-score可以检查这种微不足道的行为。# T) q" i; |3 Y  h9 B+ M
    ( Propensity-score Precision )  PSP @ k : = 1 k ∑ l ∈ rank k ( y ^ ) y l p l (\text{Propensity-score Precision}) \text{ PSP}@k := \frac{1}{k} \sum_{l\in \text{rank}_k(\hat{\mathbf{y}})} \frac{\mathbf{y}_l}{p_l}) B, q, d1 r4 g  |$ M
    (Propensity-score Precision) PSP@k:=
      P5 i3 a! N* m4 g2 R* E7 Rk" Q9 i' j/ E; i" _
    11 W  F- p! g* K( U( j: e2 X9 o
    + g* l4 W- H! c9 q/ t! d

    # c7 U$ @1 v  `# D& C( }4 nl∈rank + [5 s/ I7 t3 k$ Q
    k
    ) H; |3 u, x1 F% G. T: {% w( g1 V' G6 E' I: n
    (
    + ], r0 {8 r$ A& jy
    * M3 J$ g, \$ y. E& d. V# |^
    ; F1 R0 N" N' f0 J# v. `! X/ n# V! V6 R' u2 j' O
    )3 u4 Q3 E* ]7 ]. {& j

    . n8 }7 G# ~  I  u& r
      J/ D5 C- n. u! w+ f! t- l  Q" _5 x  J, S
    p
    2 a. J! m. i3 m5 ~1 L) {' q9 k' Bl
    5 B" _1 N. c. c% W8 }4 x: c# O
    ( Z2 v8 ^& l5 j2 o. O
    4 b6 L& l8 G' {3 [y 8 w$ h2 k& \( ]* b9 T- ]9 K1 \! C
    l
    4 G9 x3 z% B- {! u
    ; p% j7 z' X: F; j
    " B7 e( ~, G- F. m7 f( d) M
    5 h5 r0 g3 V! J/ a7 f* Y
    " @4 I3 x! k8 J# K5 k$ |; F7 T; C' [% s
    PSDCG @ k : = ∑ l ∈ rank k ( y ^ ) y l p l log ⁡ ( l + 1 ) \text{PSDCG}@k := \sum_{l \in \text{rank}_k(\hat{\mathbf{y}})} \frac{\mathbf{y}_l}{p_l\log(l+1)}$ K, h. ]% V- Q" ]4 }: t/ Q# U
    PSDCG@k:= ' I1 R8 d8 k' T5 ?9 d
    l∈rank - O5 V- w  p% j- X3 ^+ [
    k* G! X. U9 \  A6 \% N* n
    * ?# H4 e8 R8 Y8 B! G
    (
    + N3 m+ j+ [0 b$ H( T+ u; fy
    % J! P( B$ }9 _5 Q^; z; M; [' A) N+ O
    , ^8 Q( O% E* u. H3 f
    )- K: [+ l9 P7 M, A/ Z

    % w: X# C; h3 Y5 K. x- J$ \6 h0 X$ E8 p7 T6 ^6 o8 D9 x
    - C2 N7 C5 S  d
    p
    . U' J# s. d* u# j& [7 Al
    & L" K8 X8 a/ r) Q
    ! q3 C! [  P" j+ w$ F  G log(l+1)
    ( M$ i9 R! Y( ?4 [/ {4 m" _y
    ( R/ _: }1 e/ `: |) p% Wl
    8 I  r9 N2 ]4 l1 ]4 `" z0 F3 v2 x7 g" W
    " P, M) K1 R  E& h  [

    * X, z0 Y/ D) d6 k5 ~! i7 A8 Z! k9 p/ O% R! E& U1 j! |
    / ^8 a2 |: O4 ~, [9 N, K  T; X
    PSnDCG @ k : = PSDCG@ k ∑ l = 1 k 1 log ⁡ ( l + 1 ) \text{PSnDCG}@k := \frac{\text{PSDCG@$k$}}{\sum_{l=1}^{k} \frac{1}{\log(l+1)}}
    3 g, }: [! d! GPSnDCG@k:= & v5 }8 Y' J: x8 c

    $ @. d; w: r# c( f" ~: Ol=1
    / `8 v7 E& C$ p/ Z. I( G3 d  J+ t% Fk4 _9 p7 m! s: ?% i
    ' r3 W' A0 W2 n; \2 W- y9 l/ D

    " X6 W) U; i2 `log(l+1)9 q, ?% [  g% }- O, N! X$ a/ d+ z
    1' n3 ~, P, |7 p1 b% G
    ( \- P  @5 |6 ^( f2 u

    - T" P5 A4 R8 i4 fPSDCG@k
    . K7 T3 i1 L$ ?; N. E
      G  H( [: P1 x6 n5 ~3 z8 @
    ( e# |8 u& X6 [* h' m/ y( @: ~5 G$ u) Y3 I
    其中p l p_lp 5 J0 W! `  @% i+ a) F0 D3 h! P
    l
    6 U; k5 c3 E* [2 h  `7 H8 B6 v) S
    5 y; o0 N3 `* V5 o( A" }$ V 为标签l ll的propensity-score,使得这种度量在missing label方面无偏差(unbiased)。$ O, m  c! u% }3 N8 b; g5 r& `
    Propensity-score强调在tail labels上的表现,而对预测head labels提供微弱的奖励。
    ; g' W. O& U: c7 X————————————————
    1 `/ a/ E# c; h3 q1 X版权声明:本文为CSDN博主「摆烂的-白兰地」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。: ~* A6 A2 u0 g' h2 K
    原文链接:https://blog.csdn.net/wuyanxue/article/details/126805190
    5 B* ~) C) ]- `" J: u
    8 @9 D( }$ g4 _: m, Y" W0 v
    9 |3 N; q5 N" w) F% G
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-10 15:55 , Processed in 0.301677 second(s), 51 queries .

    回顶部