- 在线时间
 - 472 小时
 - 最后登录
 - 2025-9-5
 - 注册时间
 - 2023-7-11
 - 听众数
 - 4
 - 收听数
 - 0
 - 能力
 - 0 分
 - 体力
 - 7689 点
 - 威望
 - 0 点
 - 阅读权限
 - 255
 - 积分
 - 2887
 - 相册
 - 0
 - 日志
 - 0
 - 记录
 - 0
 - 帖子
 - 1161
 - 主题
 - 1176
 - 精华
 - 0
 - 分享
 - 0
 - 好友
 - 1
  
 
 
 
该用户从未签到  
  | 
这个监督式学习算法通常被用于分类问题。令人惊奇的是,它同时适用于分类变量和连续因变量。在这个算法中,我们将总体分成两个或更多的同类群。这是根据最重要的属性或者自变量来分成尽可能不同的组别。想要知道更多,可以阅读:简化决策树。 
6 @6 B. _' _( K8 P/ N' h8 L 
$ h0 p6 c2 F% B0 k9 B' A% d0 S% u; g在上图中你可以看到,根据多种属性,人群被分成了不同的四个小组,来判断 “他们会不会去玩”。为了把总体分成不同组别,需要用到许多技术,比如说 Gini、Information Gain、Chi-square、entropy。& B  b7 e1 n) `& V5 Q- ?0 j 
 
1 l; p0 k* o& s: D) p理解决策树工作机制的最好方式是玩Jezzball,一个微软的经典游戏(见下图)。这个游戏的最终目的,是在一个可以移动墙壁的房间里,通过造墙来分割出没有小球的、尽量大的空间。 
+ i; f1 X8 S2 j. a. ~4 b% w0 i 
7 V( |6 u/ q- h 
3 ?9 S+ l1 T; j/ H4 P因此,每一次你用墙壁来分隔房间时,都是在尝试着在同一间房里创建两个不同的总体。相似地,决策树也在把总体尽量分割到不同的组里去。2 T7 Z4 l8 |6 } 
 
4 ~* t$ U0 Y  V. U" |' P" S3 Q1 d  X; V4 ^% H, M* a3 l' ^# Z 
 |   
 
zan
  
 |