: u/ _! }3 q( J. c9 T9 s) j7 z+ r' [ , C( S. O# U1 X s- j9 R$ i1.1 机器学习算法包含的两个步骤4 y5 R, c ]1 u3 c- i
机器学习算法通常包括两个主要步骤:训练和预测。在训练阶段,算法使用一部分已知数据(训练数据集)来学习模型或函数的参数,以使其能够对未知数据做出准确的预测或分类。在预测阶段,算法将学习到的模型应用于新的数据,通过模型对数据进行预测、分类或其他任务。, \" D. ]" M& N& }
5 ]1 o0 ?2 `: a# S/ J# f9 S1.2 机器学习算法的分类 - X" {4 E3 {) } }/ _6 Z% A机器学习算法可以是基于统计学原理、优化方法、神经网络等等。根据学习的方式不同,机器学习算法可以分为监督学习、无监督学习和强化学习等几种类型。不同的机器学习算法适用于不同的问题和数据类型,选择合适的算法可以提高机器学习的任务效果。 " n/ C$ ~; I( x( B5 h; _, U7 O# u9 L. l
监督学习算法:监督学习算法需要训练数据集中包含输入和对应的输出(或标签)信息。常用的监督学习算法包括:线性回归、逻辑回归、决策树、支持向量机、朴素贝叶斯、人工神经网络等。 5 b: S. ? T, w$ ~ r4 G% N9 ]1 y6 \- j2 g9 N+ L2 }
无监督学习算法:无监督学习算法不需要训练数据集中的输出信息,主要用于数据的聚类和降维等问题。常用的无监督学习算法包括:K均值聚类、层次聚类、主成分分析、关联规则挖掘等。4 ?+ d2 m. x2 X4 i2 y
0 N. [5 A0 }6 w8 }# W) m
强化学习算法:强化学习算法通过与环境进行交互,试图找到最优策略来最大化奖励。常用的强化学习算法包括:Q学习、深度强化学习算法等。3 o3 z! D0 e8 U6 _* K1 |0 H
2 F1 \! P9 |7 C( G% y# G
此外,还有一些常用的机器学习算法和技术,如集成学习、降维方法、深度学习、迁移学习、半监督学习等,它们通过不同的方式和建模方法来解决不同的问题。选择合适的机器学习算法需要考虑问题的性质、数据的特点、算法的可解释性和计算效率等因素。 3 x* o8 J% _! [* v/ q # W( a3 t2 R# Q2、线性回归算法* ]3 I7 t" D4 E# q6 G6 ~ [/ i: P# Z
线性回归是一种统计方法,用于检查两个连续变量之间的关系:一个自变量和一个因变量。线性回归的目标是通过一组数据点找到最佳拟合线,然后可用于对未来的观察进行预测。 . r* K A7 Z" `( k8 D2 C. a" e0 G, v) y
# u' _* i! _9 C$ A2 o v
简单线性回归模型的方程为: ! m. n& K, I! T3 F; k& H 9 D- @9 z: j8 r& sy = b 0 + b 1 ∗ x y = b0 + b1*x6 t# l- V0 q3 V g
y=b0+b1∗x 8 }) F6 W! l5 V' S8 E3 A6 N4 v2 p9 @' a4 r5 g
其中 y 是因变量,x 是自变量,b0 是 y 截距(直线与 y 轴的交点),b1 是直线的斜率。斜率表示给定 x 变化时 y 的变化。* J3 a# a* D9 `8 L
5 F+ t; ]$ h ]* O& `" I为了确定最佳拟合线,我们使用最小二乘法,该方法找到使预测 y 值与实际 y 值之间的平方差之和最小化的线。线性回归也可以扩展到多个自变量,称为多元线性回归。多元线性回归模型的方程为:y = b 0 + b 1 x 1 + b 2 x 2 + … + b n ∗ x n y = b0 + b1x1 + b2x2 + … + bn*xny=b0+b1x1+b2x2+…+bn∗xn。其中 x1, x2, …, xn 是自变量,b1, b2, …, bn 是相应的系数。9 p' R. T4 h W& G
5 f: K0 K2 `6 s
线性回归可用于简单线性回归和多元线性回归问题。系数 b0 和 b1, …, bn 使用最小二乘法估计。一旦估计了系数,它们就可以用于对因变量进行预测。线性回归可用于对未来进行预测,例如预测股票的价格或将出售的产品的单位数量。然而,线性回归是一种相对简单的方法,可能并不适合所有问题。它假设自变量和因变量之间的关系是线性的,但情况可能并非总是如此。此外,线性回归对异常值高度敏感,这意味着如果存在任何不遵循数据总体趋势的极值,将会显着影响模型的准确性。 " M! N2 S- |) x3 K0 f$ R' N' P4 e5 c j. I4 |
总之,线性回归是一种强大且广泛使用的统计方法,可用于检查两个连续变量之间的关系。它是一个简单但功能强大的工具,可用于预测未来。但是,请务必记住,线性回归假设变量之间存在线性关系,并且对异常值敏感,这可能会影响模型的准确性。+ s1 B$ z3 j3 a# \3 T# E% m
1 z: z9 ~7 Q. p; U- q2.1 线性回归的假设是什么?- M* C/ W" \) Y$ r- C
线性:自变量和因变量之间的关系是线性的。$ ~8 Y+ i# k% }5 c4 U$ \' `+ }
! |6 z' ?$ V) l' k) H1 D
独立性:观察结果彼此独立。 3 R/ p' \3 Z& I, N$ M6 q0 r1 L% `, R2 [" W4 K
同方差性:误差项的方差在自变量的所有水平上都是恒定的。4 I0 w' H g' X& f( W1 c2 J
& w0 f" m5 @3 m6 Y调整 R 平方:调整 R 平方是 R 平方的修改版本,它考虑了模型中自变量的数量。在比较具有不同数量自变量的模型时,它可以更好地指示模型的拟合优度。 ) o) l a. k" M : o5 K; a; R* T. O' b均方根误差 (RMSE):RMSE 衡量预测值与实际值之间的差异。RMSE 较低表明模型与数据的拟合效果更好。7 g' @, Q& ]8 o$ R5 u) o) n