先解决什么是小波变换
常见的变换包括傅里叶 短时傅里叶 小波变换等
小波变换的优点是可以正交化
什么是正交基?
如果采用正交基 变换域系数没有冗余信息 变换前后信号能量相等 相当于用最少的数据表达最大的信息量 有助于数值压缩
比如典型的正交基:二维笛卡尔坐标系的(1, 0)、(0, 1),用它们表达一个信号显然非常高效,计算简单。而如果用三个互成120°的向量表达,则会有信息冗余,有重复表达。但是并不意味着正交一定优于不正交。比如如果是做图像增强,有时候反而希望能有一些冗余信息,更利于对噪声的抑制和对某些特征的增强。
正交小波
小波变换
傅里叶变换给出了信号的频域信息,意味着告诉我们信号中每个频率有多少,但它没有告诉我们这些频谱成分在什么时候存在(when in time)。对于平稳(stationary)信号是不需要这个信息的。
当需要对频谱成分进行时间定位(time localization)时,需要对信号进行“时间-频率”表示的变换。短时傅里叶变换通过添加时间窗口(时间窗)来处理非平稳信号,但时间窗的宽度有时不能精准确定,所以基于小波变换的方法被提出。
小波变换是作为STFT的一种替代方法而发展起来的,但是小波变换的出发点和STFT不同。STFT是给信号加窗,分段做FFT;而小波变换直接替换了傅里叶变换的基,将无限长的三角函数基换成了有限长的会衰减的小波基。
小波变换继承和发展了STFT的局部化思想,它克服了傅里叶变换的局限性以及STFT窗口不变的缺点。小波变换主要通过伸缩和平移实现多尺度细化,突出所要处理的问题细节,有效提取局部信息。小波变换给出了一个可以调节的时频窗口,窗口的宽度随频率变化。频率增高时,时间窗口的宽度自动变窄,以提高分辨率,“采用小波分析,就像使用一架可变焦距镜头的照相机一样,可以转向任一细节部分”。
“小”即具有衰减性,“波”是指具有波动性。
小波基函数
小波基函数,简称小波基,又称为小波母函数。小波基函数经过尺度变换、时移 等,可得到一系列小波函数,简称小波。
其中,( a , τ ) 为任意实数对,参数a 必须为非零实数。一般称参数 a为尺度因子(即STFT中的 ω \omegaω),负责调节小波函数的伸缩程度,与频率信息相对应。而参数 τ 为平移因子或时间中心参数(即STFT中的 t ),负责调节小波函数的平移程度,与时间信息相对应。
只有在原点附近才会有明显偏离水平轴的波动,在远离原点的地方其函数值将迅速衰减为零。小波基函数趋向于零的速度是衡量小波基函数性质好坏的一个重要标志。
连续小波变换CWT
表示以基函数为标准 f(t)变化快慢 在t=桃附近 一维信号 变为二维
离散小波变换DWT
对阿尔法和陶进行离散化 解决了冗余信息 也可以在计算机中表示
小波变换对比傅里叶
小波变换相比于STFT,有以下优势:
- 由于小波基函数相当于窗函数,但其窗宽是可变的,较好地解决了时间分辨率和频率分辨率的矛盾,其变化规律使得小波变换具有优良的局部化特性,对分析突变信号和奇异信号非常有效,充分体现了常相对带宽频率分析和自适应分析的思想;
- 小波变换能将各种交织在一起的由不同频率组成的混合信号分解成不同频率的信号,并对频率大小不同的信号采用相应粗细的时空域取样步长,从而能够不断聚焦到对象的任意微小细节,对时变信号的频谱分析意义重大。
- 不要求小波变换基底是正交的,其时宽频宽乘积较小,因而展开系数的能量较为集中。
- 傅里叶变换不具有局部性;
- STFT有局部性,但有一些缺点(如前所述);小波变换不但具有局部性,而且尺度参数a可以改变频谱结构和窗口的形状,起到“变焦”的作用,因此小波分析可能达到多分辨率分析的效果(小变波换被誉为数学显微镜)。
- 从信号分析方法的理论发展过程可能看出:傅里叶分析特别适合分析长时间内较稳定的信号;STFT也有其一定的应用场合,但其效果取决于适当地选取窗函数;小波分析特别适合分析突变信号和奇异信号
优点如下
具有高的灵活性。小波能够应用于数字图像,在处理数字图像时可以看作是与离散有关的数学问题。
可以表示局部特征。不管是在高频段还是低频段,小波都有相应的处理方式。
减少冗余度。能够用较少的信息来表达图像的主要特征,减少不必要的信息。
处理图像的精度比较高。图像是由一个个像素点组成的,通过处理像素点之间的距离和灰度量化数量级来提高精度。
小波变换的多分辨率特性使其既可以高效描述图像的平坦区域(低频信息、全局信息),也可以有效处理图像信号的局部突变(高频信息,即图像的边缘轮廓等部分)。小波变换在空域和频域同时具有良好的局部性,使其可以很好地聚焦到图像的任意细节。
从公式可以看出,不同于傅里叶变换,变量只有频率ω,小波变换有两个变量:尺度a aa(scale)和平移量 τ(translation)。尺度a控制小波函数的伸缩,平移量 τ 控制小波函数的平移。尺度就对应于频率(反比),移量 就对应于时间。
如上图,当伸缩、平移到这么一种重合情况时,也会相乘得到一个大的值。这时候和傅里叶变换不同的是,这不仅可以知道信号有这样频率的成分,而且知道它在时域上存在的具体位置。当我们在每个尺度下都平移和信号乘过一遍后,就知道信号在每个位置都包含哪些频率成分。
下采样过程
二阶分解过程
- LL子带是原始图像的近似表示。它是由水平方向和垂直方向使用低通小波滤波器卷积后得到的小波系数。
- HL子带 (原始图像的水平方向细节子图),用来凸显图像水平方向的奇异特性,它是使用高通小波滤波器在水平方向卷积后,再通过低通小波滤波器在垂直方向上卷积得到的小波系数;
- LH子带 (原始图像的垂直方向细节子图),用来凸显图像垂直方向的奇异特性,它是使用低通小波滤波器在水平方向卷积后,再通过高通小波滤波器在垂直方向上卷积得到的小波系数;
- HH子带 (原始图像的对角线方向细节子图),用来凸显图像的对角边缘特性,它是由水平和垂直两个方向使用高通小波滤波器卷积后得到的小波系数。
1、Wavelet Transform Convolution
视觉Transformer (ViT) 的自注意力机制能够进行全局特征混合,而卷积神经网络 (CNN) 受限于局部混合。为了弥补这一差距,一些研究尝试增加 CNN 的卷积核大小,但很快达到上限并饱和。现有方法要么参数量过大,要么难以扩展到全局感受野。所以这篇论文提出一种 小波变换卷积(Wavelet Transform Convolution)。
WTConv 通过利用小波变换 (WT) 将输入分解成不同频率的分量。对每个频率分量分别进行小核卷积,每个卷积关注不同的频率范围。
对于输入X,WTConv 的实现过程:
小波分解: 使用 Haar 小波变换将输入图像分解成低频和高频分量,并进行下采样。
多频卷积: 对不同频率分量分别进行小核深度可分离卷积。
小波重建: 将不同频率分量的卷积结果进行加权求和,并进行上采样,得到最终的输出。
优势:
感受野更大: 通过级联小波分解和卷积,可以实现更大的感受野,同时参数量仅随感受野大小呈对数增长。
低频响应更强: 小波变换能够更好地捕捉低频信息,从而提高模型对形状的识别能力。
鲁棒性更强: 对低频信息更强的响应使得模型对图像噪声和退化更加鲁棒。
可扩展性更强: 可以作为深度可分离卷积的替代方案,轻松地集成到现有的 CNN 架构中。
参考文章:
通俗易懂理解小波变换(Wavelet Transform)-CSDN博客
(即插即用模块-Convolution部分) 十七、(2024 ECCV) WTConv 小波变换卷积_小波conv-CSDN博客