空洞卷积(膨胀卷积)公式解析

发布于:2024-07-31 ⋅ 阅读:(108) ⋅ 点赞:(0)

空洞卷积(膨胀卷积)公式解析

空洞卷积的作用

空洞卷积(Dilated Convolution)通过在卷积核的元素之间插入空格来“膨胀”内核,从而扩大感受野。膨胀率参数 L L L表示要扩大内核的范围,即在内核元素之间插入 L − 1 L-1 L1个空格。当 L = 1 L=1 L=1时,内核元素之间没有插入空格,变为标准卷积。空洞卷积的公式如下:

y ( m , n ) = ∑ i = 1 M ∑ j = 1 N x ( m + r ⋅ i , n + r ⋅ j ) ⋅ w ( i , j ) y(m,n) = \sum_{i=1}^{M} \sum_{j=1}^{N} x(m+r \cdot i, n+r \cdot j) \cdot w(i,j) y(m,n)=i=1Mj=1Nx(m+ri,n+rj)w(i,j)

其中, y ( m , n ) y(m,n) y(m,n)是输出特征图的元素, x ( m + r ⋅ i , n + r ⋅ j ) x(m+r \cdot i, n+r \cdot j) x(m+ri,n+rj)是输入特征图的元素, w ( i , j ) w(i,j) w(i,j)是卷积核的元素, M M M N N N分别是卷积核的高度和宽度, r r r是膨胀率( r = L − 1 r=L-1 r=L1)。在这里插入图片描述

通俗解释

  1. 空洞卷积的核心思想

    • 通过在卷积核之间插入空格来扩大卷积核的感受野。
    • 膨胀率 L L L决定了插入空格的数量。
  2. 膨胀率的作用

    • 膨胀率 L L L越大,卷积核的感受野越大。
    • 感受野的扩大可以帮助模型捕捉更广泛的上下文信息。
  3. 空洞卷积的应用

    • 空洞卷积常用于图像分割、目标检测等任务中。
    • 通过扩大感受野,模型可以更好地理解图像中的空间关系。

具体来说:

项目 描述
感受野 卷积核在输入特征图上能够“看到”的区域范围。
膨胀率 膨胀率 L L L表示在卷积核元素之间插入的空格数量。
空洞卷积 通过在卷积核之间插入空格来扩大感受野的卷积方式。

过程推导如下

  1. 标准卷积
    首先,我们回顾一下标准卷积的公式:

    y ( m , n ) = ∑ i = 1 M ∑ j = 1 N x ( m + i , n + j ) ⋅ w ( i , j ) y(m,n) = \sum_{i=1}^{M} \sum_{j=1}^{N} x(m+i, n+j) \cdot w(i,j) y(m,n)=i=1Mj=1Nx(m+i,n+j)w(i,j)

    其中, y ( m , n ) y(m,n) y(m,n)是输出特征图的元素, x ( m + i , n + j ) x(m+i, n+j) x(m+i,n+j)是输入特征图的元素, w ( i , j ) w(i,j) w(i,j)是卷积核的元素。

  2. 引入膨胀率
    在空洞卷积中,我们在卷积核的元素之间插入空格。这可以通过修改卷积核在输入特征图上的滑动方式来实现。具体来说,我们将卷积核在输入特征图上的滑动步长设置为膨胀率 r r r r = L − 1 r=L-1 r=L1)。这样,卷积核在滑动时就会跳过一些输入特征图的元素,从而在卷积核元素之间插入空格。

  3. 空洞卷积公式
    将膨胀率 r r r引入标准卷积公式中,我们得到空洞卷积的公式:

    y ( m , n ) = ∑ i = 1 M ∑ j = 1 N x ( m + r ⋅ i , n + r ⋅ j ) ⋅ w ( i , j ) y(m,n) = \sum_{i=1}^{M} \sum_{j=1}^{N} x(m+r \cdot i, n+r \cdot j) \cdot w(i,j) y(m,n)=i=1Mj=1Nx(m+ri,n+rj)w(i,j)

    其中, r r r是膨胀率( r = L − 1 r=L-1 r=L1),其他符号的含义与标准卷积公式相同。

综上所述,空洞卷积通过引入膨胀率来扩大卷积核的感受野。这种卷积方式可以帮助模型捕捉更广泛的上下文信息,从而在某些任务(如图像分割、目标检测)中取得更好的性能。

Keywords: 空洞卷积, 膨胀卷积, 感受野, 膨胀率, 卷积核.

关键词标签形式

#空洞卷积
#膨胀卷积
#感受野
#膨胀率
#卷积核


网站公告

今日签到

点亮在社区的每一天
去签到