空洞卷积(膨胀卷积)公式解析
空洞卷积的作用
空洞卷积(Dilated Convolution)通过在卷积核的元素之间插入空格来“膨胀”内核,从而扩大感受野。膨胀率参数 L L L表示要扩大内核的范围,即在内核元素之间插入 L − 1 L-1 L−1个空格。当 L = 1 L=1 L=1时,内核元素之间没有插入空格,变为标准卷积。空洞卷积的公式如下:
y ( m , n ) = ∑ i = 1 M ∑ j = 1 N x ( m + r ⋅ i , n + r ⋅ j ) ⋅ w ( i , j ) y(m,n) = \sum_{i=1}^{M} \sum_{j=1}^{N} x(m+r \cdot i, n+r \cdot j) \cdot w(i,j) y(m,n)=i=1∑Mj=1∑Nx(m+r⋅i,n+r⋅j)⋅w(i,j)
其中, y ( m , n ) y(m,n) y(m,n)是输出特征图的元素, x ( m + r ⋅ i , n + r ⋅ j ) x(m+r \cdot i, n+r \cdot j) x(m+r⋅i,n+r⋅j)是输入特征图的元素, w ( i , j ) w(i,j) w(i,j)是卷积核的元素, M M M和 N N N分别是卷积核的高度和宽度, r r r是膨胀率( r = L − 1 r=L-1 r=L−1)。
通俗解释
空洞卷积的核心思想
- 通过在卷积核之间插入空格来扩大卷积核的感受野。
- 膨胀率 L L L决定了插入空格的数量。
膨胀率的作用
- 膨胀率 L L L越大,卷积核的感受野越大。
- 感受野的扩大可以帮助模型捕捉更广泛的上下文信息。
空洞卷积的应用
- 空洞卷积常用于图像分割、目标检测等任务中。
- 通过扩大感受野,模型可以更好地理解图像中的空间关系。
具体来说:
项目 | 描述 |
---|---|
感受野 | 卷积核在输入特征图上能够“看到”的区域范围。 |
膨胀率 | 膨胀率 L L L表示在卷积核元素之间插入的空格数量。 |
空洞卷积 | 通过在卷积核之间插入空格来扩大感受野的卷积方式。 |
过程推导如下
标准卷积:
首先,我们回顾一下标准卷积的公式:y ( m , n ) = ∑ i = 1 M ∑ j = 1 N x ( m + i , n + j ) ⋅ w ( i , j ) y(m,n) = \sum_{i=1}^{M} \sum_{j=1}^{N} x(m+i, n+j) \cdot w(i,j) y(m,n)=i=1∑Mj=1∑Nx(m+i,n+j)⋅w(i,j)
其中, y ( m , n ) y(m,n) y(m,n)是输出特征图的元素, x ( m + i , n + j ) x(m+i, n+j) x(m+i,n+j)是输入特征图的元素, w ( i , j ) w(i,j) w(i,j)是卷积核的元素。
引入膨胀率:
在空洞卷积中,我们在卷积核的元素之间插入空格。这可以通过修改卷积核在输入特征图上的滑动方式来实现。具体来说,我们将卷积核在输入特征图上的滑动步长设置为膨胀率 r r r( r = L − 1 r=L-1 r=L−1)。这样,卷积核在滑动时就会跳过一些输入特征图的元素,从而在卷积核元素之间插入空格。空洞卷积公式:
将膨胀率 r r r引入标准卷积公式中,我们得到空洞卷积的公式:y ( m , n ) = ∑ i = 1 M ∑ j = 1 N x ( m + r ⋅ i , n + r ⋅ j ) ⋅ w ( i , j ) y(m,n) = \sum_{i=1}^{M} \sum_{j=1}^{N} x(m+r \cdot i, n+r \cdot j) \cdot w(i,j) y(m,n)=i=1∑Mj=1∑Nx(m+r⋅i,n+r⋅j)⋅w(i,j)
其中, r r r是膨胀率( r = L − 1 r=L-1 r=L−1),其他符号的含义与标准卷积公式相同。
综上所述,空洞卷积通过引入膨胀率来扩大卷积核的感受野。这种卷积方式可以帮助模型捕捉更广泛的上下文信息,从而在某些任务(如图像分割、目标检测)中取得更好的性能。
Keywords: 空洞卷积, 膨胀卷积, 感受野, 膨胀率, 卷积核.
关键词标签形式
#空洞卷积
#膨胀卷积
#感受野
#膨胀率
#卷积核