transforms机制与数据标准化

发布于:2023-07-08 ⋅ 阅读:(324) ⋅ 点赞:(0)
文章和代码已经归档至【Github仓库:https://github.com/timerring/dive-into-AI 】或者公众号【AIShareLab】回复 pytorch教程 也可获取。

图像预处理 transforms

transforms运行机制

torchvision:计算机视觉工具包

  • torchvision.transforms

    常用的图像预处理方法,例如:

    • 数据中心化
    • 数据标准化
    • 缩放
    • 裁剪
    • 旋转
    • 翻转
    • 填充
    • 噪声添加
    • 灰度变换
    • 线性变换
    • 仿射变换
    • 亮度、饱和度及对比度变换

  • torchvision.datasets

    常用数据集的 dataset 实现, MNIST CIFAR 10 ImageNet 等

  • torchvision.model

    常用的模型预训练, AlexNet VGG ResNet GoogLeNet 等

transforms运行的机制

数据标准化transforms.normalize

transforms.Normalize

标准化的含义是将数据的均值变为0,标准差变为1。

功能:逐channel 的对图像进行标准化

output = (input - mean) / std

  • mean :各通道的均值
  • std :各通道的标准差
  • inplace :是否原地操作

对数据进行标准化后可以加快模型的收敛。通过比较不同的实验结果可知,一个好的数据分布更加利于模型的整体收敛。