数学建模社区-数学中国
标题: 机器学习笔记十:各种熵总结(二) [打印本页]
作者: 重光兰衣 时间: 2018-11-1 10:22
标题: 机器学习笔记十:各种熵总结(二)
机器学习笔记十:各种熵总结(二)二.相对熵相对熵又称互熵,交叉熵,鉴别信息,Kullback熵,Kullback-Leible散度(即KL散度)等。 5 W) d3 r. V# B
设p(x)和q(x)是取值的两个概率概率分布,则p对q的相对熵为:
. s+ D. f# V9 _) h2 I1 d7 y: D" ]
在一定程度上面,相对熵可以度量两个随机变量的距离。也常常用相对熵来度量两个随机变量的距离。当两个随机分布相同的时候,他们的相对熵为0,当两个随机分布的差别增大的时候,他们之间的相对熵也会增大。 T1 Q6 J0 F% F# }$ [
但是事实上面,他并不是一个真正的距离。因为相对熵是不具有对称性的,即一般来说
相对熵还有一个性质,就是不为负。
$ L) j' e9 y; e* j1 I
' l d1 X# u" S( ?三.互信息
5 k# u2 |- o% \) P0 B. r' W互信息(Mutual Information)是信息论里一种有用的信息度量,它可以看成是一个随机变量中包含的关于另一个随机变量的信息量,或者说是一个随机变量由于已知另一个随机变量而减少的不确定性。
9 x+ [* x% t5 d$ ]两个随机变量X,Y的互信息,定义为X,Y的联合分布和独立分布乘积的相对熵。
' }9 [3 Y, N; X: @, @9 u4 p
( _) v, x; r, {4 D* {
$ b5 b* j1 j) Q3 X1 H/ C
那么互信息有什么更加深层次的含义呢?首先计算一个式子先:
" V0 |7 Z( c- ?0 B- b& p
8 Z. x9 P2 B8 _3 I- |8 _& ]* [7 c从这个公式可以知道,X的熵减去X和Y的互信息之后,可以得到在Y给定的情况下X的熵。
四.总结
5 w1 H! v( h$ q' ^; @- g4 T* b
* _) d$ s4 L* L1 E# v" B8 t6 O/ d. q+ L! }5 b
- m( f& g+ r% A7 ^8 R4 e* }" Z+ [
| 欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) |
Powered by Discuz! X2.5 |