机器学习实战中文双页版

[复制链接]

字体大小: 正常放大

2744557306

1186 主题	4 听众	2922 积分

该用户从未签到

电梯直达

1^#

发表于 2024-8-20 10:12 |只看该作者 |倒序浏览

|招呼Ta 关注Ta

本书前两部分主要探讨监督学习(supervisedlearning)。在监督学习的过程中，我们只需要给定输入样本集，机器就可以从中推演出指定目标变批的可能结果。监督学习相对比较简单，机器只需从输入数据中预测合适的模型，并从中计算出目标变量的结果。一监督学习般使用两种类型的目标变最：标称型和数值型。标称型目标变噩的结果只在有限目标集中取值，如真与假、动物分类集合｛爬行类、鱼类、哺乳类、两栖类、植物、真菌｝；数值型目标变量则可以从无限的数值集合中取值，如0.100、42.001、1000.743等。数值型目标变量主要用千回归分析，将在本书的第二部分研究，第一部分主要介绍分类。
本书的前七章主要研究分类算法，第2章讲述最简单的分类算法：k-近邻算法，它使用距离矩阵进行分类；第3章引入了决策树，它比较直观，容易理解，但是相对难千实现；第4章将讨论如何使用概率论建立分类器；第5章将讨论Logistic回归，如何使用最优参数正确地分类原始数据，在搜索最优参数的过程中，将使用几个经常用到的优化算法；第6章介绍了非常流行的支持向最机；第部分最后的第7章将介绍元算法－AdaBoost,它由若干个分类器构成，此外还总结了第一部分探讨的分类算法在实际使用中可能面对的非均衡分类问题，且训练样本某个分类的数据多千其他分类的数据，就会产生非均衡分类问题。