本书涵盖了机器学习中的重要概念和主题。它从数据清理开始,并概述了特征选择。然后讨论训练和测试、交叉验证和特征选择。这本书涵盖了最常见的特征选择技术的算法和实现。然后,本书重点介绍线性回归和梯度下降。本书涵盖了一些重要的分类技术,例如 K-最近邻、逻辑回归、朴素贝叶斯和线性判别分析。然后,它概述了神经网络,并解释了生物学背景、感知器的局限性和反向传播模型。支持向量机和核方法也包含在本书中。然后展示了如何实现决策树和随机森林。
最后,本书简要概述了无监督学习。涵盖了各种特征提取技术,例如傅里叶变换、STFT 和局部二分类模式。本书还讨论了主成分分析及其实现。
你会学到什么本书涵盖了机器学习的主要议题。它从数据清理开始,并简要介绍了可视化的情况。本书的第一章讲述了机器学习的介绍、训练和测试、交叉验证和特征选择。第二章介绍了最常见的特征选择技术的算法和实现,如Fisher Discriminant ratio和互信息。
第三章向读者介绍了线性回归和梯度下降。后者将被许多算法所使用,这些算法将在本书后面讨论。一些重要的分类技术,如K-近邻、逻辑回归、朴素贝叶斯和线性判别分析,已经在下一章中讨论和实现。接下来的两章集中讨论了神经网络和它们的实现。这两章系统地解释了生物学背景、感知器的局限性和反向传播模型。下一章讨论了支持向量机和核方法。随后是决策树和随机森林的简要概述和实施。
最后一章讨论了无监督学习方法的概念,如K-means和光谱聚类。
书中给出了用Python实现的方法,因此附录中包括了NumPy、Pandas和Matplotlib的小抄。
本书主要特点欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) | Powered by Discuz! X2.5 |