【随机森林?】最近比较火的算法!!对图像特征的分类
在处理图像特征分类问题上,随机森林算法绝对是算一个非常好的方法。这几天一直在看随机森林的相关论文以及文献,今天一条朋友圈的信息,也看到了有关于“树”的深度发展的文章,所以分享一下我搜集的随机森林算法
首先跟大家说一下随机森林算法是什么.
"在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。 而 "Random Forests" 是他们的商标。 这个术语是1995年由贝尔实验室的Tin Kam Ho所提出的随机决策森林(random decision forests)而来的。这个方法则是结合 Breimans 的 "Bootstrap aggregating" 想法和 Ho 的"random subspace method"以建造决策树的集合."
这里面需要注释一下:
分类器:分类器就是给定一个样本的数据,判定这个样本属于哪个类别的算法。例如在股票涨跌预测中,我们认为前一天的交易量和收盘价对于第二天的涨跌是有影响的,那么分类器就是通过样本的交易量和收盘价预测第二天的涨跌情况的算法。
分裂:在决策树的训练过程中,需要一次次的将训练数据集分裂成两个子数据集,这个过程就叫做分裂。
特征:在分类问题中,输入到分类器中的数据叫做特征。以上面的股票涨跌预测问题为例,特征就是前一天的交易量和收盘价。
待选特征:在决策树的构建过程中,需要按照一定的次序从全部的特征中选取特征。待选特征就是在目前的步骤之前还没有被选择的特征的集合。例如,全部的特征是 ABCDE,第一步的时候,待选特征就是ABCDE,第一步选择了C,那么第二步的时候,待选特征就是ABDE。
分裂特征:接待选特征的定义,每一次选取的特征就是分裂特征,例如,在上面的例子中,第一步的分裂特征就是C。因为选出的这些特征将数据集分成了一个个不相交的部分,所以叫它们分裂特征。
希望可以帮助到近期在图像特征分类遇到问题的同学!!!
好了废话不多说,
66666666666666666666666666
666666666666666666666666666666666
6666666666666666666666666666666666
666666666666666666666666666666666666666666
灰常有用啦~蟹蟹~
666666666666666
6666666666666666666
666666666666
页:
[1]