数学建模社区-数学中国

标题: 机器学习笔记十:各种熵总结(二) [打印本页]

作者: 重光兰衣    时间: 2018-11-1 10:22
标题: 机器学习笔记十:各种熵总结(二)
机器学习笔记十:各种熵总结(二)二.相对熵

相对熵又称互熵,交叉熵,鉴别信息,Kullback熵,Kullback-Leible散度(即KL散度)等。 + G0 Z1 c% j+ y
设p(x)和q(x)是取值的两个概率概率分布,则p对q的相对熵为:

# i8 o3 h& M4 O- T0 V7 g
在一定程度上面,相对熵可以度量两个随机变量的距离。也常常用相对熵来度量两个随机变量的距离。当两个随机分布相同的时候,他们的相对熵为0,当两个随机分布的差别增大的时候,他们之间的相对熵也会增大。
5 e8 l) W' f& V  `' F但是事实上面,他并不是一个真正的距离。因为相对熵是不具有对称性的,即一般来说 相对熵还有一个性质,就是不为负。$ @. ?! Z& }: L+ C

8 R1 D$ @3 ^0 W三.互信息/ Q" l+ Y. w' ]# q) z1 E4 U
互信息(Mutual Information)是信息论里一种有用的信息度量,它可以看成是一个随机变量中包含的关于另一个随机变量的信息量,或者说是一个随机变量由于已知另一个随机变量而减少的不确定性。
& p2 \+ w# H4 d0 H: d9 e两个随机变量X,Y的互信息,定义为X,Y的联合分布和独立分布乘积的相对熵。
* z/ A( ]; V2 Z3 Z  ^( H7 h0 Q( D0 V, a. a
" e0 T$ i5 c9 B9 U
那么互信息有什么更加深层次的含义呢?首先计算一个式子先: ) D6 E' K6 q9 D5 }6 d6 v. s
& H( Z* `  l/ k& H; \. k4 L

从这个公式可以知道,X的熵减去X和Y的互信息之后,可以得到在Y给定的情况下X的熵。

四.总结0 s3 T" g+ R# f+ r, k. x: V! t
* L( U4 V5 Y# @% D: T. D6 U- R

) ~0 J7 y+ l4 j
1 n* p2 ^) s6 u




欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5