- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564661 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174621
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
+ |! ]3 k& }, e$ _ ^. m1 Q极限多标签分类-评价指标& s6 ]: ~' e" m4 D8 v+ n
# b" x, s, Q: J) k( k. x极限多标签分类-评价指标
) P6 A; n8 [; q4 t5 NReferences:
N% _6 X4 N# n3 thttp://manikvarma.org/downloads/XC/XMLRepository.html
. V M7 a* m$ v0 j7 y3 t5 {* W& R' q" nhttps://blog.csdn.net/minfanphd/article/details/126737848?spm=1001.2014.3001.5502
- v! ?3 Y: O# X- v, \https://en.wikipedia.org/wiki/Discounted_cumulative_gain
( R( U# i' I4 c7 W" L$ n6 d4 H, ?# Y4 }1 [
什么是极限多标签分类 (eXtreme multi-label Classification (XC))?
4 k4 u2 w; [) U' \0 m N4 ~3 C标签数非常多(Million),典型的就是BoW数据标签。& c9 k* q, O% e' h* E6 x
极限多标签分类的典型应用:Image Caption(头大)。不过在Image Caption里面,Word之间存在序关系。XC可以看成是Image Caption的一个关键阶段,它能够选出与当前Image最相关的BoW。' U. e! q: Y3 s6 o4 B! ^
(上述都是靠过往经验吹的,近期没调研)。# x4 K9 N, I1 Y% l$ B
Z; t4 [- N* \+ {) u- @
先来看一下评价指标:
! q# O3 D' f: Q2 ~% v5 q由于标签数非常多,且GroundTruth又非常小,因此通常意义上的分类精度、召回(多标签分类用macro或者micro的acc或者recall)等指标不work。
' J# T: S# s+ a这些评价指标通常考虑了head/tail labels,也就是高频标签和低频标签;以及reciprocal pairs(互惠对)去除?
5 t( r( X2 P; f) O互惠对似乎?是指彼此相关的标签对,比如针对一个数据点,如果预测了标签A,如果标签B和A相关,那可以自然预测B。3 p! o& C3 C; q# a. J
为了避免这种trival prediction, reciprocal pairs应该被去除。% _: s# t4 t0 ~$ n2 r; L
! X- a2 \5 z7 ?3 a& _) S
(1) Top-k kk Performance:
" f1 l+ B! P1 N' w# k(Precision@ k ) P @ k : = 1 k ∑ l ∈ rank k ( y ^ ) y l \text{(Precision@$k$)}\text{P}@k := \frac{1}{k}\sum_{l \in \text{rank}_k (\hat{\mathbf{y}})} \mathbf{y}_l
7 W- B1 p% w. n" `7 h$ E( y(Precision@k)P@k:= $ P: t# U* \9 H- z, Z
k! N, Z# z: o1 k" I
1# s0 O: _8 j3 j, ? r
0 N2 A$ Q. K! M F7 T
/ T8 @4 A0 V- n2 @1 {
l∈rank - I* u0 g9 G+ A
k6 D1 V( y/ h3 s9 z4 a- _
8 z. w+ `& r, a8 \! p
(
4 v& K& _6 }4 M/ H; Iy
- ]: i2 a4 q# K2 S' y) T^
0 `4 s$ h) V4 k1 G" w
3 r9 W1 ^) p# d' W# Z0 M. M3 U0 D )
: L- f& F4 A5 W; C' q∑
/ z3 ?8 l) i# N" k. N; a _9 H" R, ?# ^! b" H7 Y
y " Y- v3 N1 y' ~* }2 {7 Y& l4 ^5 C
l. v$ }$ h% L6 m1 g2 J% c3 |- v' \
: |2 r2 ?' Y% `' c$ ]% Y6 G
2 y/ p* Z$ S1 L- ~1 ^" E, m, t' m9 N0 ?& Y+ s& C. e; g7 r
(Discounted Cumulative Gain (贴现累积收益))DCG @ k : = ∑ l ∈ rank k ( y ^ ) y l log ( l + 1 ) \text{(Discounted Cumulative Gain (贴现累积收益))} \text{DCG}@k := \sum_{l \in \text{rank}_k(\hat{\mathbf{y}})} \frac{\mathbf{y}_l}{\log(l+1)}/ m& C4 k2 W, [
(Discounted Cumulative Gain (贴现累积收益))DCG@k:= 0 [/ o$ ]5 m/ D" c
l∈rank 5 A6 l( \- k9 [8 B
k! A0 H8 ~7 O- I3 `" o
2 ~* \- N* |8 w2 V; { ( 8 M& ]; E- {% p& [# V- Y& H
y8 h* Q! q1 a$ K, k
^
1 F8 ~+ z% ?3 S/ a
) L5 X# J' D3 g% a. h8 Z )) X7 R& u& ?/ o4 o6 L
∑
' @$ s- D6 p" [3 q' \& b, l8 @" ~
5 D) t5 a! N4 R2 {$ {1 O+ } {; h6 }log(l+1)$ s+ V8 F3 A6 j- @% a
y
) n5 H- f( y) T1 u0 G/ }2 Sl' \. }; A2 T/ ~. ~+ T
- E9 z+ V x7 M% x; V8 M* R% ]
+ s3 d# U9 j6 \0 ~( q- o
5 x7 @) g% b$ ~/ d) F9 o8 g2 ]
+ o: f) ^7 R& z9 Z, H
" n" {" b& y" ]) W(Normalized DCG)nDCG @ k : = DCG@ k ∑ l = 1 min ( k , ∣ ∣ y ∣ ∣ 0 ) 1 log ( l + 1 ) \text{(Normalized DCG)} \text{nDCG}@k := \frac{\text{DCG@$k$}}{\sum_{l=1}^{\min(k,||\mathbf{y}||_0)} \frac{1}{\log(l+1)}}+ \ g6 f, `* Y- E3 J) b
(Normalized DCG)nDCG@k:=
& ?5 Y+ G% T( ^6 P; i. {' N* t∑ 9 ^. n9 F5 M, u: t& X) H6 H! C
l=16 m6 \% o2 f9 _" I8 d" P
min(k,∣∣y∣∣
( R1 o4 z* T2 @" p" ]" S* F- J$ u2 B0
~& O" I1 I* c `5 b0 H/ H$ [# T; c" o. i
)
4 i6 w7 e3 h+ W0 t+ p- Y6 g+ O; i( z3 l5 O6 {1 q5 x4 Y
9 T! q3 A y/ q& f: w" }3 jlog(l+1)
# D" `% U0 K% J K% k, {* I( s* e17 w2 G* U- w/ Z8 v" N
: j5 O: s2 t5 P$ Z) \$ Q2 g! \# u3 K& c& x
DCG@k1 Q% j/ O; S# x3 o7 S
7 W3 z7 d3 }6 Y
2 l% ?5 B u- I3 [/ P$ V( q
. H7 }4 ?0 V6 x
rank k ( y ) \text{rank}_k(\mathbf{y})rank
% C/ Z: @! ?; F! J, r4 p) z9 }5 k lk
1 E$ Q8 u: H/ L) i; T) n4 L" @7 K, a$ T, ?
(y)为逆序排列y \mathbf{y}y的前k个下标。Note: DCG公式里的分母实际上不是l,而是from 1 to k.
1 {) [1 a5 L- Y2 V3 S
8 A+ w ]2 D8 C/ D4 V0 c靠后的标签按照对数比例地减小,说白了就是加权。至于为什么用log?两个事实:1. 平滑缩减; 2. Wang等人提供了理论支撑说明了log缩减方式的合理性。The authors show that for every pair of substantially different ranking functions, the nDCG can decide which one is better in a consistent manner. (看不懂,暂时不管)
$ N' |# J7 e. [4 l& L$ P. i7 s& J% `5 f" y9 J
(2) Top-k kk Propensity-score:
: U+ A f. I4 {
8 V; |6 f5 I! ~5 R% e有些数据集包含一些频度很高的标签(通常称之为head labels),可以通过简单地重复预测头部标签来实现高的P @ k \text{P}@kP@k。Propensity-score可以检查这种微不足道的行为。( D7 \, R9 W) @' A$ A/ _
( Propensity-score Precision ) PSP @ k : = 1 k ∑ l ∈ rank k ( y ^ ) y l p l (\text{Propensity-score Precision}) \text{ PSP}@k := \frac{1}{k} \sum_{l\in \text{rank}_k(\hat{\mathbf{y}})} \frac{\mathbf{y}_l}{p_l}
8 A& X7 w- h9 i( i(Propensity-score Precision) PSP@k:= & s) B$ W. y% X6 M7 O5 H' d
k, A( u i( s0 P$ s" E
1
6 V8 I2 j5 N. D* w. R& j. k7 r# ?- e3 w- @
/ ~8 |7 I$ k" N3 q5 a
l∈rank # T5 U, o8 F1 c$ M6 ?& H: ]7 s
k" t* B" R4 x2 v/ I8 C
3 n3 W9 x& R( I7 u ( 3 F- F) ?% k4 A1 c. i4 {, s# z
y
E. X( S( U1 V e5 b+ B) R^+ R' W8 v# i2 y# u
- m% {/ c, H6 p; A& [: Z5 o1 p4 G
)2 V L+ ?2 A9 ^# X( ~
∑+ l. x& m; O# A$ c
8 ]# w0 @ d0 j* N' R6 r! E+ b- h3 p
p
7 n1 \, d) t0 s9 bl, F/ W; x% ]6 I2 ^. F
8 C1 _ D' h+ G, w7 ?; l1 @* ]" ?" Y8 y+ O% H7 C( i: k
y 7 T1 X- Z% J, B, T' P
l
8 \0 X5 c$ Z v2 a) |; @8 X2 o: [) v! b* M k
8 m4 a1 p, }, J. z9 Q0 W2 w
% r+ i( w( S) ^( C
/ b6 a, H- T& }- |; O5 ]6 ]
' a2 u( u P0 {6 `5 hPSDCG @ k : = ∑ l ∈ rank k ( y ^ ) y l p l log ( l + 1 ) \text{PSDCG}@k := \sum_{l \in \text{rank}_k(\hat{\mathbf{y}})} \frac{\mathbf{y}_l}{p_l\log(l+1)}6 ]7 V9 ]1 y ~0 I( O
PSDCG@k:= 2 I e, J' F' @+ I, w
l∈rank
! A$ }# D2 ?- F/ zk
7 j. n9 ]% z6 L' R* r& r
9 a3 e4 N2 F3 y (
6 I! L# e' X! F3 s9 j) Ay# h% s% v8 c' l% l
^8 v7 }: l* a2 o2 q/ r: ~
# \. d+ n+ U% E$ a8 Z )
4 x+ q2 P" S2 T∑ I0 _" _- O4 e# e f
5 F& R6 x' a) r, `, \8 Q* o* J4 c' D- [% ^4 m6 I: @+ ?' z
p . I! |1 i( Q( g$ x3 L- f
l
+ b! o$ ^6 D9 ^. U: T( D0 G4 O3 e
log(l+1)
7 s& |9 Q/ [) R' K/ K7 Ty
2 D- [- w0 J+ p: h) U7 xl9 \8 Y Y; p; ?1 D( e: X
+ p z9 u0 \2 p* }# r
' L1 Q! p |; h9 b) o9 O9 K
( r* F5 G( P4 N7 w* T, p+ `5 i) Z+ i+ }: i- F' X4 i
6 P6 y- w, q' T% Z% SPSnDCG @ k : = PSDCG@ k ∑ l = 1 k 1 log ( l + 1 ) \text{PSnDCG}@k := \frac{\text{PSDCG@$k$}}{\sum_{l=1}^{k} \frac{1}{\log(l+1)}}
: }7 P/ [8 S5 @9 APSnDCG@k:=
) u$ j/ g6 |, E* H! X∑
% c& B* L; u1 }7 L N( h @l=1/ C( H4 F$ X" f5 n6 ^
k
?. d+ m9 o }! ^9 v) S% B- x& d# G# u& E
/ c' @( R8 d( o3 E/ I
log(l+1)0 u$ L7 [# }7 o+ Q- o
1
# e/ g+ ? F3 {- K) a/ I# _* w) h7 x( ]* t& _) M! ~$ ~7 @, u
4 p0 f' Z* b0 r" {* w8 D
PSDCG@k& G- ?# m) \! P
4 r+ Y) w& T/ H: d$ C- u; R
" X. S' M/ b: }; ~7 C3 |" B& q# q& l, T" M9 b# d' D N
其中p l p_lp
. y. u y6 u+ Ql2 S, q' s6 i0 |# U8 g
8 p& r9 {+ g9 F
为标签l ll的propensity-score,使得这种度量在missing label方面无偏差(unbiased)。
: t: M) `& j: M" ?6 C2 F9 kPropensity-score强调在tail labels上的表现,而对预测head labels提供微弱的奖励。
; w- b; b- t4 n9 u" X. I————————————————
" \& O/ D! S* ~版权声明:本文为CSDN博主「摆烂的-白兰地」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
( [6 V# n7 C4 V" o. t v原文链接:https://blog.csdn.net/wuyanxue/article/details/126805190
$ S# O1 F+ o* {( L
) l* x8 c0 _- \* I/ M% l2 X4 F2 L8 k
; c' {9 L& Q4 E) ]* n- H% E0 ? |
zan
|