特征提取TD分析、FD分析和TD–FD分析

发布于:2025-06-13 ⋅ 阅读:(21) ⋅ 点赞:(0)

信号处理中特征提取的三种核心方法:时域分析 (TD Analysis)频域分析 (FD Analysis)时频联合分析 (TD-FD Analysis)。理解这三种方法并知道何时使用哪一种,对于从原始信号数据中提取有意义、可区分的特征至关重要。

一 核心概念

任何随时间变化的物理现象(如振动、声音、脑电图、心电图、股票价格、传感器数据等)都可以被视为一个信号。特征提取就是从这些原始信号中计算或推导出能够代表信号关键属性(如能量、周期、频率组成、不规则性等)并且对后续任务(如分类、识别、监测)更有用的量(特征)。

1.1 时域分析 

核心思想: 在原始时间轴(x轴是时间,y轴是幅度)上观察和分析信号的演变。

关注点: 信号的幅度、时间波形、瞬时值、变化率、事件发生的时序、统计特性。

直观性: 非常直观,信号呈现的样子与我们在物理世界中直接观察或感受的方式最接近。

适用信号特性: 瞬态冲击、过零点间隔、峰值、上升/下降时间、信号整体的统计特性(如均值、方差、峰度、偏度)、能量或包络信息。

其形式如下图所示:

统计特征:

均值: 信号的平均值,代表 DC 分量或稳定状态水平。

标准差/方差: 信号偏离均值的程度,代表信号整体的波动/能量大小(注意:方差等于均方值减去均值的平方)。

均方根值 : RMS值,代表信号的有效功率或能量(交流分量),其平方等于平均功率。对于零均值信号,RMS = 标准差。

峰值/峰峰值: 最大绝对值/最大值与最小值的差。

峰峰值(PP)与 RMS 比值: Crest Factor (波峰因数),衡量信号冲击性的指标。

峭度: 表征信号概率密度分布尖锐程度的指标。高斯噪声峭度≈3。峭度 >3 的信号含有较多冲击成分(信号分布比高斯更尖锐);峭度 <3 的信号则相对平坦平滑。

偏度: 表征信号概率密度分布不对称程度的指标。正偏度表示左侧(负值)拖尾长;负偏度表示右侧(正值)拖尾长。高斯噪声偏度≈0。

波形特征:

上升时间/下降时间: 信号从低电平到高电平(或反之)所需的时间。

过零点率: 单位时间内信号穿越零点的次数。粗略反映信号的平均频率。

能量/包络特征:

总能量: (对于离散信号) sum(x[i]²) for i=1 to N(其中 x[i] 是第 i 个采样点值)。

包络: 反映信号幅度的整体轮廓,可通过希尔伯特变换 (Hilbert Transform) 提取。提取包络后,可以再对包络做时域分析(如计算其峰值、RMS、频率成分等)。

相关特征:

自相关函数: 衡量信号与其自身在不同时间偏移量下的相似性。可以揭示信号的周期性(峰值间隔对应周期)。

互相关函数: 衡量两个不同信号在不同时间偏移量下的相似性,用于信号对齐、延迟估计等。

 

1.2 频域分析

将信号变换到频域进行特征计算。核心数学工具是傅里叶变换 (Fourier Transform, FT),特别是其针对离散信号的快速实现 FFT

核心思想: 将信号从一个或多个频率分量的角度来描述。认为任何复杂的信号都可以看作是由许多不同频率、不同幅度的基本正弦波(或余弦波)叠加而成。傅里叶变换是核心数学工具。

关注点: 信号能量/功率在不同频率分量上的分布。某个特定频率成分的存在与否、强度大小。

直观性: 不直观,它不直接展示信号随时间的变化,而是展示其频率“成分”。

适用信号特性: 周期性(确定周期及其谐波)、振动特征(如固有频率)、噪声特性(宽带噪声 vs. 窄带噪声引起的谱峰)、调制(如幅度调制、频率调制)。

如下图所示:

关键概念:

频谱: 信号的频率构成图。

基波: 信号中最明显的周期成分的频率。

谐波: 基波频率整数倍的频率分量(通常由非线性产生)。

边频带: 由于调制(如齿轮啮合、滚动轴承缺陷)在载波(啮合频率/通过频率)两侧对称出现的频率分量,其间隔等于调制频率(如旋转频率)。

常用特征:

谱中特征频率的幅值: 如基波幅值、特定谐波幅值、特定边带(及其组合)幅值。

谱中频率分量的位置: 基频、各谐波频率及其变化。

各频率分量的相位: 相对相位有时也作为特征(较少单独用)。

主频: 幅度最高的频率分量。

重心频率: sum(f[i] * P[i]) / sum(P[i]),其中 P[i] 是频率 f[i] 处的功率谱值。代表能量的集中区域。

均方频率: sum(f[i]² * P[i]) / sum(P[i]),比重心频率更高阶的统计。

频率方差: sum((f[i] - FC)² * P[i]) / sum(P[i]) (FC 是重心频率),衡量频率成分在重心附近的集中度。

峭度 / 偏度 (应用于频谱数据):类似时域,描述频谱形状。

谐波与噪声比: 反映周期性信号成分与背景噪声的对比。

特定频带的能量: 计算某频段内功率谱积分(带通滤波器的能量)。

1.3 时频联合分析

为解决非平稳信号的频率成分随时间变化的分析需求而生。其核心目标是在时间-频率平面上直观地展示信号能量(或幅度)的二维分布。

核心思想: 同时捕捉信号在时域和频域的特性。因为许多实际信号(如语音、音乐、机械冲击噪声、地震波、生物医学信号)的频率成分会随着时间变化(称为非平稳信号)。纯时域或纯频域分析无法既知道频率成分是什么,又知道它在何时出现

关注点: 分析信号中不同频率分量是如何随时间诞生、演变(强度变化、频率偏移)和消失的。

直观性: 相对直观,通常是使用二维图像(时间轴和频率轴,能量/幅度用颜色表示)来表示。

适用信号特性: 任何非平稳的信号,特别是那些频率随时间变化的信号,瞬态事件的发生时刻,信号的局部频率特性。

基本原理: 通过引入时间局部化或尺度变换的思想,实现时间和频率的同时分辨率。

主要方法:

短时傅里叶变换、小波变换(连续小波变换、离散小波变换)、希尔伯特-黄变换、Wigner-Ville 分布、S变换、经验小波变换

    二 三种方法的优缺点

    2.1 时域优缺点

    优点:

    计算简单快速。

    结果直观,易于物理意义解释。

    对某些直接反映在波形上的特征(冲击、包络变化)敏感。

    缺点:

    对信号中的频率成分变化不敏感,无法直接揭示信号的频率构成。

    容易受到噪声干扰。

    对于周期性复杂信号,特征的区分度可能不够高。

    2.2 频域优缺点

    优点:

    直接揭示信号的内在频率成分(基频、谐波、边带、背景噪声)。

    对周期性、振动信号的特征提取非常有效。

    能有效抑制部分噪声(白噪声在频域上均匀分布)。

    特征的区分度通常比基于纯时域波形分析的特征更好。

    缺点:

    完全丢失时间信息! 无法知道某个频率分量发生在信号的哪个时间段。

    对于非平稳信号(频率成分随时间变化的信号),傅里叶变换只显示所有频率成分的整体平均效果,可能掩盖重要细节。

    计算量比基础时域统计特征稍大(但 FFT 非常高效)。

    瞬态事件的位置和结构不敏感。需要理解和选择窗函数、频率分辨率等参数。

    2.3 时频联合优缺点

    优点:

    同时保留时间信息和频率信息,直观展示频率成分随时间的变化。

    是处理非平稳信号的强大工具。

    能有效定位瞬态事件(如冲击、语音中的爆破音)。

    揭示信号的动态特性。

    缺点:

    计算方法复杂,计算量通常比TD或FD分析大很多。

    参数选择更复杂(窗长类型长度/小波基/尺度/阈值等)。

    需要更多的专业知识和经验来解读结果和提取有意义的特征。

    特征维度通常很高,可能需要进一步降维处理(如主成分分析)。

    存在分辨率限制和交叉项问题(尤其在WV分布中)。

    三 三种方法的适用场景

    3.1 时域适用场景

    判断信号是否有脉冲或冲击(利用峭度、峰值)。

    计算信号的平均能量水平(RMS)。

    简单的健康状态指示(如设备空载运行时的振动RMS)。

    时间序列数据的初步探索和清洗(均值、方差检查)。

    3.2 频域适用场景

    旋转机械故障诊断: 识别轴承缺陷(特定特征频率及其谐波)、齿轮故障(啮合频率的调制边带)、转子动不平衡(基频振动过大)。

    音频分析: 音调识别(基频)、语音识别(共振峰频率)。

    电力系统: 谐波分析、电能质量评估。

    通信: 载波频率、调制类型识别。

    3.3 时频适用场景

    语音信号处理: 区分不同的音素(元音、辅音)、识别说话人、情感分析(声音变化模式)。

    故障诊断: 检测齿轮、轴承在启动/停机的非稳态过程中的瞬时冲击或故障特征频率变化;分析非平稳振动/噪声信号。

    生物医学信号分析: EEG/ECG信号中的瞬间事件(癫痫波形、心拍波形位置特征)。

    地震信号处理: 检测不同的地震波(P波、S波)及其到达时间/特征频率。

    声呐/雷达信号处理: 探测非平稳回波信号。

    四 对比总结

    特性 时域分析 (TD) 频域分析 (FD) 时频联合分析 (TD-FD)
    关注点 幅度变化、时间波形、统计特性 频率成分及其强度 频率成分随时间演变
    核心工具 统计计算、相关性 FFT (快速傅里叶变换) STFT (短时傅里叶变换)、WT (小波变换)、HHT等
    时间分辨率 优秀 (瞬时值)  (整个时间段平均) 良好到优秀 (依赖于方法和参数)
    频率分辨率 优秀 (理论分辨率由信号长度决定) 良好 (STFT有分辨率折衷,WT自适应分辨率高)
    处理非平稳信号 可能丢失关键全局模式 完全失效 (只能看平均效应) 非常适合 (专为此设计)
    计算复杂度 中 - 低 (FFT效率高)  (尤其连续、精细分析情况下)
    特征解释性 直观简单 直观但需要频谱知识 较专业,需同时理解时频变化
    主要优点 速度快、直观,适合冲击检测 清晰揭示频率特征,区分周期性成分 揭示动态特性,分析瞬态变化,适用非平稳信号
    主要缺点 不区分频率,易受噪声干扰 完全丢失时间信息,无法分析瞬态 计算复杂,参选选择困难,特征可能维度高
    典型输出 时间序列图、统计值 频谱图、光谱 时频谱图、尺度图、瞬时频率曲线
    典型应用 信号质量监控、简单状态识别 旋转机械故障诊断、音调识别 语音/音频分析、非平稳振动分析、医学/地震信号分析

    对信号不了解? 先做时域分析(看波形、算基本统计量),再做频域分析(FFT看频谱主峰/谐波)。

    信号是明显周期性的? 优先考虑频域分析(FFT)。

    信号是单个或稀疏瞬态冲击? 考虑时域分析(利用峭度、峰值等)或小波变换(定位冲击位置和频率)。

    信号的频率成分随时间明显变化(如语音、音乐、机器启停机过程)?必须使用时频联合分析方法(STFT或WT)。

    需要同时知道某个事件发生的时间和对应的频率特性? 选择时频联合分析。

    计算资源紧张? 优先考虑TD或FD(尤其是FFT),慎重选择TD-FD(特别是高分辨率要求时)。