9 v4 { }) _- f. h我们可以看出,这种分类的信息熵是0.8,它的信息增益是0.17095& F4 H8 G T9 M+ b% ]8 B
( Z. B) t3 E! J" s% k
显然第一种分类的信息增益较大 * }" t# j; g9 K1 t, e' n1 V8 s( c* w# s5 o7 r: J3 s
3 z' F+ e7 W1 z( z$ W8 [( k4 H我们来看一下啊两个划分的结果集:' N: b' v. x: e1 z% w
- S. A# u S( c 8 G5 s$ {/ G7 k$ s% Q# x5 v1 {确实第一种方法划分的较好。# f; L, k! p1 d7 f2 V! p8 X8 v
这样我们的决策树也就构建好了:+ B# y7 h+ X/ I" J' ^. z