DAY09：【pytorch】nn网络层-EW帮帮网

1、卷积层

1.1 Convolution

1.1.1 卷积操作

卷积运算：卷积核在输入信号（图像）上滑动，相应位置上进行乘加
卷积核：又称为滤波器、过滤器，可认为是某种模式、某种特征

1.1.2 卷积维度

一般情况下，卷积核在几个维度上滑动就是几维卷积

一维卷积
二维卷积
三维卷积

1.2 `nn.Conv2d`

在这里插入图片描述

# nn.Conv2d(
#     in_channels,
#     out_channels,
#     kernel_size,
#     stride=1,
#     padding=0,
#     dilation=1,
#     groups=1,
#     bias=True,
#     padding_mode='zeros'
# )

1.2.1 基本介绍

功能：对多个二维信号进行二维卷积
主要参数：

in_channels：输入通道数
out_channels：输出通道数，等价于卷积核个数
kernel_size：卷积核尺寸
stride：步长
padding：填充个数
dilation：空洞卷积大小
groups：分组卷积设置，默认为1，即不分组
bias：是否使用偏置

尺寸计算：
$H_{out} = \lfloor \frac{H_{in} + 2 \times padding[0] - dilation[0] \times (kernel\_size[0] - 1) - 1}{stride[0]} + 1 \rfloor$

1.2.2 代码框架

    conv_layer = nn.Conv2d(3, 1, 3)   # input:(i, o, size) weights:(o, i , h, w)
    nn.init.xavier_normal_(conv_layer.weight.data)

    img_conv = conv_layer(img_tensor)

1.3 `nn.ConvTranspose`

# nn.ConvTranspose(
#     in_channels,
#     out_channels,
#     kernel_size,
#     stride=1,
#     padding=0,
#     output_padding=0,
#     groups=1,
#     bias=True,
#     dilation=1,
#     padding_mode='zeros'
# )

1.3.1 基本介绍

功能：用于对图像进行上采样

对比：

正常卷积：假设图像尺寸为4×4，卷积核为3×3，padding=0，stride=1，
则图像： $I_{16*1}$ ，卷积核： $K_{4*16}$ ，输出： $O_{4*1}=K_{4*16}×I_{16*1}$
转置卷积：假设图像尺寸为2×2，卷积核为3×3，padding=0，stride=1，
则图像： $I_{4*1}$ ，卷积核： $K_{16*4}$ ，输出： $O_{16*1}=K_{16*4}×I_{4*1}$

主要参数：

in_channels：输入通道数
out_channels：输出通道数
kernel_size：卷积核大小
stride：步长
padding：填充
dilation：空洞卷积大小
groups：分组卷积
bias：是否使用偏置

尺寸计算： $H_{out} = (H_{in} - 1) \times stride[0] - 2 \times padding[0] + dilation[0] \times (kernel\_size[0] - 1) + output\_padding[0] + 1$

1.3.2 代码框架

	conv_layer = nn.ConvTranspose2d(3, 1, 3, stride=2)   # input:(i, o, size)
    nn.init.xavier_normal_(conv_layer.weight.data)

    img_conv = conv_layer(img_tensor)

2、池化层

2.1 概念

在这里插入图片描述

对信息进行收集并总结，类似水池收集水资源，因而得名池化层

收集：多变少
总结：最大值/平均值

2.2 `nn.MaxPool2d`

# nn.MaxPool2d(
#     kernel_size,
#     stride=None,
#     padding=0,
#     dilation=1,
#     return_indices=False,
#     ceil_mode=False,
# )

2.2.1 基本介绍

功能：对二维信号（图像）进行最大值池化
主要参数：

kernel_size：池化核大小
stride：步长
padding：填充
dilation：池化核间隔大小
return_indices：是否返回最大值索引
ceil_mode：是否向上取整

2.2.2 代码框架

MaxPool2d

	maxpool_layer = nn.MaxPool2d((2, 2), stride=(2, 2))   # input:(i, o, size) weights:(o, i , h, w)
    img_pool = maxpool_layer(img_tensor)

MaxPool2d unpool

    # pooling
    img_tensor = torch.randint(high=5, size=(1, 1, 4, 4), dtype=torch.float)
    maxpool_layer = nn.MaxPool2d((2, 2), stride=(2, 2), return_indices=True)
    img_pool, indices = maxpool_layer(img_tensor)

    # unpooling
    img_reconstruct = torch.randn_like(img_pool, dtype=torch.float)
    maxunpool_layer = nn.MaxUnpool2d((2, 2), stride=(2, 2))
    img_unpool = maxunpool_layer(img_reconstruct, indices)

2.3 `nn.AvgPool2d`

# nn.AvgPool2d(
#     kernel_size,
#     stride=None,
#     padding=0,
#     ceil_mode=False,
#     count_include_pad=True,
#     divisor_override=None
# )

2.3.1 基本介绍

功能：对二维信号（图像）进行平均值池化
主要参数：

kernel_size：池化核大小
stride：步长
padding：填充
ceil_mode：是否向上取整
count_include_pad：是否包含填充的像素
divisor_override：除数重写

2.3.2 代码框架

AvgPool2d

	avgpoollayer = nn.AvgPool2d((2, 2), stride=(2, 2))   # input:(i, o, size) weights:(o, i , h, w)
    img_pool = avgpoollayer(img_tensor)

AvgPool2d divisor_override

	img_tensor = torch.ones((1, 1, 4, 4))
    avgpool_layer = nn.AvgPool2d((2, 2), stride=(2, 2), divisor_override=3)
    img_pool = avgpool_layer(img_tensor)

3、线性层

3.1 概念

在这里插入图片描述

又称全连接层，其每个神经元与上一层所有神经元相连实现对前一层的线性组合、线性变换

3.2 `nn.Linear`

# nn.Linear(
#     in_features,
#     out_features,
#     bias=True
# )

3.2.1 基本介绍

功能：对一维信号（向量）进行线性组合

主要参数：

in_features：输入结点数
out_features：输出结点数
bias：是否使用偏置

计算公式： $y = xW^T + bias$

3.2.2 代码框架

	inputs = torch.tensor([[1., 2, 3]])
    linear_layer = nn.Linear(3, 4)
    linear_layer.weight.data = torch.tensor([[1., 1., 1.],
                                             [2., 2., 2.],
                                             [3., 3., 3.],
                                             [4., 4., 4.]])

    linear_layer.bias.data.fill_(0.5)
    output = linear_layer(inputs)

4、激活函数层

4.1 `nn.Sigmoid`

在这里插入图片描述

计算公式： $\frac{1}{1 + e^{-x}}$

梯度公式： $y^{`} = y \times (1 - y)$

特性：

输出值在(0, 1)，符合概率
导数范围是[0, 0.25]，易导致梯度消失
输出为非0，破坏数据分布

4.2 `nn.tanh`

在这里插入图片描述
计算公式： $\frac{sinx}{cosx} = \frac{e^x - e^{-x}}{e^{-} + e^{-x}} = \frac{2}{1 + e^{-2x}} + 1$

梯度公式： $y^{`} = 1 - y^2$

特性：

输出值在(-1, 1)，数据符合0均值
导数范围是(0, 1)，易导致梯度消失

4.3 `nn.ReLU`

在这里插入图片描述
计算公式： $y = ma x (0, x)$

梯度公式：
$\begin{cases} 1, & x > 0 \\ \text{undefined}, & x = 0 \\ 0, & x < 0 \end{cases}$

特性：

输出值均为正数，负半轴导致死神经元
导数是1，缓解梯度消失，但易引发梯度爆炸

在这里插入图片描述

4.3.1 `nn.LeakuReLU`

negative_slope: 负斜率的值，默认为0.01，即负斜率

4.3.2 `nn.PReLU`

init：可学习斜率

4.3.3 `nn.RReLU`

lower：均匀分布下限
upper：均匀分布上限

微语录：黑暗中有人擎花而来，惊动火焰，燃烧万千蝴蝶迷了眼。

DAY09：【pytorch】nn网络层

1、卷积层

1.1 Convolution

1.1.1 卷积操作

1.1.2 卷积维度

1.2 `nn.Conv2d`

1.2.1 基本介绍

1.2.2 代码框架

1.3 `nn.ConvTranspose`

1.3.1 基本介绍

1.3.2 代码框架

2、池化层

2.1 概念

2.2 `nn.MaxPool2d`

2.2.1 基本介绍

2.2.2 代码框架

2.3 `nn.AvgPool2d`

2.3.1 基本介绍

2.3.2 代码框架

3、线性层

3.1 概念

3.2 `nn.Linear`

3.2.1 基本介绍

3.2.2 代码框架

4、激活函数层

4.1 `nn.Sigmoid`

4.2 `nn.tanh`

4.3 `nn.ReLU`

4.3.1 `nn.LeakuReLU`

4.3.2 `nn.PReLU`

4.3.3 `nn.RReLU`

网站公告

今日签到

热门文章

最新发布

DAY09：【pytorch】nn网络层

1、卷积层

1.1 Convolution

1.1.1 卷积操作

1.1.2 卷积维度

1.2 nn.Conv2d

1.2.1 基本介绍

1.2.2 代码框架

1.3 nn.ConvTranspose

1.3.1 基本介绍

1.3.2 代码框架

2、池化层

2.1 概念

2.2 nn.MaxPool2d

2.2.1 基本介绍

2.2.2 代码框架

2.3 nn.AvgPool2d

2.3.1 基本介绍

2.3.2 代码框架

3、线性层

3.1 概念

3.2 nn.Linear

3.2.1 基本介绍

3.2.2 代码框架

4、激活函数层

4.1 nn.Sigmoid

4.2 nn.tanh

4.3 nn.ReLU

4.3.1 nn.LeakuReLU

4.3.2 nn.PReLU

4.3.3 nn.RReLU

网站公告

今日签到

热门文章

最新发布

1.2 `nn.Conv2d`

1.3 `nn.ConvTranspose`

2.2 `nn.MaxPool2d`

2.3 `nn.AvgPool2d`

3.2 `nn.Linear`

4.1 `nn.Sigmoid`

4.2 `nn.tanh`

4.3 `nn.ReLU`

4.3.1 `nn.LeakuReLU`

4.3.2 `nn.PReLU`

4.3.3 `nn.RReLU`