查看: 2023|回复: 0

[其他资源] 图像预处理中的标准化处理

字体大小: 正常放大

1175 主题	4 听众	2866 积分

该用户从未签到

电梯直达

1^#

发表于 2023-8-9 15:50 |只看该作者 |倒序浏览

|招呼Ta 关注Ta

在深度学习中最常见的两种图像预处理的方式就是图像的标准化和归一化。在本文中我们聊一聊图像的标准化及图像标准化的作用。

图像标准化是将数据通过去均值实现中心化的处理，根据凸优化理论与数据概率分布相关知识，数据中心化符合数据分布规律，更容易取得训练之后的泛化效果, 数据标准化是数据预处理的常见方法之一。它的数学公式就是(输入数据-数据均值)/数据标准差。该方法的最终目的就是将图像中的像素值进行调整，使其服从标准正态分布或具有特定的均值和标准差。

在上面式子中计算数据的均值和数据的标准差通常是每个通道的均值和标准差。对于彩色图像，通常使用RGB颜色空间，其中每个像素由红色（R）、绿色（G）和蓝色（B）三个通道组成。因此，在图像数据的标准化中，会计算每个通道的均值和标准差，以便对每个通道进行独立的标准化处理。

那么对于标准化我们这样做的目的是什么呢？

对于相同的两张图片，一张对比度高，一张对比度底。里面的主体都是一只小狗，两张图片的标签都是小狗，对于我们人类而言，无论图片进行怎样的处理，我们都会认为这张图片照的是小狗，对于计算机而言，在不进行图像预处理时，由于灰度、曝光等原因，它们的像素值是不一样的，在经过卷积后形成的特征就有可能不同，对于计算机而言有一个问题，那就是特征值不一样，它的标签也是不一样的。但是标签是一样的话，模型该如何训练呢。这时我们的标准化就排上用场了。

对于常见Z-Sore标准化方法，在图像使用了该方法后，所得到的数据都在0附近，标准差都为1，符合正态分布。这样的数据消除了图象数据在像素值上的明显差异，使不同通向之间具有相似的数据分布，提高了模型的泛化能力，使其在从未见过的图像上表现得更好。于此同时它可以帮助模型在训练中更快的收敛，避免了极端像素值对于模型训练的不利影响，方便和其他相似分布特性的图片进行比较和合并。

zan