: c% q' F1 W* i0 X" z寻找数据中模式的问题是一个基本且历史悠久的研究领域,取得了显著的成功。例如,16世纪的天文学家Tycho Brahe通过大量观测数据,帮助Johannes Kepler发现了行星运动的经验规律,这为经典力学的发展奠定了基础。类似地,20世纪初期原子光谱规律的发现对量子力学的发展和验证起到了重要作用。 , z2 B K5 _: D- j( Z- ]3 r* r 9 j% f/ w: V \) S模式识别领域专注于利用计算机算法自动发现数据中的规律,并基于这些规律进行数据分类等操作。在处理每秒钟产生的大量像素时,直接将这些像素输入复杂的模式识别算法在计算上是不可行的。因此,目标是找到可以快速计算的有用特征,这些特征能够保留重要的判别信息,以便有效区分人脸和非人脸。这些特征随后被用作模式识别算法的输入。! {8 @+ z4 X5 z2 j. ^- j. B) m
# ?! H8 P% F1 U$ C/ |例如,图像中一个矩形小区域内的灰度平均值可以快速计算(Viola和Jones, 2014),并且一组这样的特征在快速人脸检测中被证明是非常有效的。由于这些特征的数量通常少于像素的数量,因此这种预处理代表了一种维数降低的形式。然而,需要注意的是,在预处理阶段,信息往往会被遗弃。如果这些信息对问题的解决至关重要,系统的整体精度可能会下降。1 t3 @/ i% ?. t4 d
5 U, r3 R+ L9 O; v. l4 `训练数据的样本通常包含输入向量及其对应的目标输出(标签),用于训练模式识别算法。& Q u. B4 q& c9 @6 n# G$ S
( V' j6 Y2 c! C" `5 n$ U/ Z
, y+ M8 o) g0 m9 }- z' Q6 y; _
, H2 L9 @9 c. a t- N9 Q* J& E' C