这篇论文主要介绍了一种基于改进型图注意力网络(Graph Attention Network, GAT)的滑坡变形异质性监测方法。该方法通过融合多尺度时间嵌入和自适应图学习,能够同时捕捉监测点之间复杂的时空依赖关系,有效反映滑坡的局部与整体变形特征。
论文以中国三峡库区的三个滑坡实例(Muyubao、Baishuihe和Shuping)为研究对象,使用现场GPS监测数据进行建模和验证。实验结果显示,该GAT模型在滑坡变形预测的准确度、稳定性和早期异常检测方面优于传统的单点时间序列预测模型(如LSTM、GRU)以及其他多传感器图卷积模型(如GCN、VAE)。
此外,论文还详细分析了模型的超参数调优、训练效率和预测性能在不同时间步长下的变化,探讨了其在异质性滑坡环境中节点级与图级状态监测的表现,强调了自适应图结构对提升模型预测精度的重要性。
最后,论文指出该方法虽然表现优异,但仍存在对监测点布局依赖大、计算复杂度较高、未纳入环境因素等限制,并展望未来结合物理信息图神经网络、引入环境变量以及开发轻量化模型用于实时监测的研究方向。
总体来看,这篇论文为滑坡变形的时空动态监测和早期预警提供了一种先进的图神经网络解决方案,推动了滑坡灾害风险管理的智能化和精细化发展。
作者信息:
- Huajin Lia,b,c * Yu Zhua * Qiang Xub * Ran Tanga,b,c * Chuanhao Pub * Yusen Hed
作者单位:
a. School of Architecture and Civil Engineering, Chengdu University, Chengdu, Sichuan, China
成都大学 建筑与土木工程学院,四川 成都
b. State Key Laboratory of Geo-hazard Prevention and Geo-environment Protection, Chengdu University of Technology, Chengdu, Sichuan, China
成都理工大学 地质灾害防治与地质环境保护国家重点实验室,四川 成都
c. Sichuan Engineering Research Center for Mechanical Properties and Engineering Technology of Unsaturated Soils, Chengdu University, Chengdu, Sichuan, China
成都大学 四川非饱和土力学性质与工程技术研究中心,四川 成都
d. Department of Industrial and System Engineering, University of Iowa, Iowa City, IA, USA
美国 爱荷华大学 工业与系统工程系,爱荷华州 爱荷华城
期刊 Geomatics, Natural Hazards and Risk(2025)
[1] Li H, Zhu ,Yu, Xu ,Qiang, et al. Condition monitoring of heterogeneous landslide deformation in spatio-temporal domain using advanced graph attention network[J]. Geomatics, Natural Hazards And Risk, 2025, 16(1): 2519429.
文章目录
摘要
滑坡变形模式的实时监测对于灾害预警与风险防控具有重要意义。野外观测表明,滑坡体内部的变形过程通常分布不均且存在异质性,形成动态不确定性,给预测模型带来了严峻挑战。为此,本文旨在构建一套可有效捕捉复杂变形模式的时空监测系统。本研究提出了一种新型图注意力网络(Graph Attention Network, GAT)框架,融合了多尺度时间嵌入、自适应图学习以及时间自注意力机制,能够同时追踪监测点局部稳定性变化与整体变形趋势。该框架的核心创新在于:实现了由同质变形状态向异质变形状态转变的检测,并基于图层级(graph-level)而非传统节点层级(node-level)设定预警机制。通过对中国Muyubao、白水河和书坪三处滑坡体监测数据的验证结果表明,所提出方法在异质性变形状态识别方面较现有方法具有显著优势。本研究为滑坡早期预警系统提供了新路径,提升了对空间变形模式差异的检测能力,为滑坡高风险区的风险评估与防控策略优化提供了有力支撑。
关键词
滑坡状态监测;时空分析;图注意力网络;异质性变形检测;风险防控
收到日期:2025年2月17日
录用日期:2025年6月5日
1. 引言
1.1 文献综述
滑坡是指岩石、土壤和碎屑沿斜坡向下运动的自然地质现象,尤其在山地地区,滑坡灾害对人类社会构成了严重威胁。这类大规模运动过程表现出复杂的流变学特性,包括渐进性蠕变变形、逆行性破坏以及与应变相关的材料软化,最终可能导致灾难性的位移事件。因此,滑坡变形状态的监测对于灾害预警与风险防控至关重要,能够通过识别失稳的早期迹象,及时开展干预措施与风险缓释策略的制定(Li et al., 2018)。滑坡状态监测不仅有助于深入揭示斜坡失稳机理,支撑预测模型与综合风险评估体系的建立,同时也是科学决策、应急响应以及人员与财产安全保障的重要手段。
随着技术与研究手段的不断进步,滑坡状态监测方法也经历了多次迭代演化,持续拓展对滑坡灾害过程的预测、缓释与适应能力。传统的滑坡变形监测方法主要可分为基于物理模型与基于数据驱动模型两大类。物理模型主要基于一般蠕变理论、大型室内试验及现场物理参数观测,开展滑坡变形监测与预测。早期,Saito(1965)首次提出了基于物理模型的边坡位移预测方法,揭示了滑坡处于三级蠕变阶段时,失稳时间与应变速率之间的反比关系。此后,Voight(1989)发展了包含应变速率相关材料破坏特性的物理模型,显著提升了滑坡失稳预测精度。随后,地理信息技术的引入,使滑坡位移理论估算成为可能。Dietrich et al.(1995)构建了将物理机制与滑动面深度相结合的模型,综合分析流域地形、地质与水文特征。Petley et al.(2005)在意大利东北部 Tessina 滑坡开展详细调查,结合高精度电子测距(EDM)系统数据,优化了滑坡预测方法。Karpouza et al.(2024)基于土体液化特性,开发了希腊东北 Peloponnese 地区滑坡灾害制图方法,Bathrellos et al.(2024)将物理模型与统计模型相结合,识别出四个滑坡运动阶段,强调地下水动力过程对滑坡行为的关键影响。
与此同时,基于统计理论与机器学习方法的数据驱动模型近年也取得了显著进展。Yin et al.(2010)在三峡库区构建了实时滑坡监测预警系统,通过传感器监测地表位移、孔隙水压力、降雨量及库水位变化。Stähli et al.(2015)强调需建立高效早期预警系统(EWS),倡导科学家、工程师与管理机构跨学科协作,将技术创新转化为可操作性预警系统。Cai et al.(2016)开发了遗传算法优化的 LSSVM 滑坡位移预测框架,Huang et al.(2016)将离散小波变换(DWT)与极限学习机(ELM)结合,构建混合型滑坡位移预测模型。Gan et al.(2019)探讨了滑坡演化中的时空变形模式,与本研究关注的滑坡由同质变形向异质变形状态转变问题密切相关。Guardiani et al.(2021)通过贝叶斯优化方法提升基于机器学习滑坡位移预测模型的计算效率,Pham et al.(2021)比较了多种机器学习方法在滑坡易发性制图中的适用性。这些研究共同凸显了融合先进方法与跨学科协作在滑坡监测与预测中的重要潜力。
近年来,深度学习方法凭借其卓越的预测精度与非线性关系建模能力,已逐渐成为滑坡变形预测领域的主流(Nava et al., 2023)。该类算法依托神经网络结构与海量数据,可有效提取复杂变形模式,提升滑坡行为预测能力(Li et al., 2020)。在滑坡变形预测应用中,常用输入变量包括降雨量、土壤含水率、地下水位、库水位变化及历史位移记录,输出通常为未来位移值或变形趋势预测(Anantrasirichai et al., 2018;Giordan et al., 2018;Mayr et al., 2018;Deng et al., 2021;Yokoya et al., 2022)。Pecoraro et al.(2019)对基于深度学习的滑坡局地预警系统应用开展系统综述,汇总了系统构成、监测网络、观测参数、仪器设备及性能指标等关键信息,为系统设计与运维提供了实践参考。Thirugnanam et al.(2020)则探讨了滑坡预警系统面临的挑战,提出在缺乏实时监测数据时,采用机器学习算法开展临近预报与趋势预测,以提升系统可靠性。Li H et al.(2021)将 Box-Cox 变换与 LSTM 集成模型相结合,实现了剧烈坡面变形的高精度预测。Khalili et al.(2023)提出改进型 GCN-LSTM 模型,融合多源异质数据预测滑坡变形。Nava et al.(2023)对七种深度学习方法在滑坡位移预测中的表现进行了对比分析,覆盖多种地理、地质与气象条件,致力于提升滑坡预警系统的先进性与适应性。Youssef et al.(2024)基于集成学习方法评估并制图埃及西奈半岛南部滑坡易发性,采用多指标交叉验证手段提升预测模型的可靠性与精度。这些研究共同印证了深度学习在滑坡监测预测中的技术变革潜力。
然而,滑坡变形过程通常呈现复杂且异质性显著的特性(Deng et al., 2021),当前大部分研究仍依赖单点 GPS 监测与单变量时间序列结构,难以捕捉滑坡变形过程中的复杂时空特性。近年来,图神经网络(Graph Neural Networks, GNNs)作为一种新兴方法,已在多领域展现出建模复杂关系型数据的强大能力(Cao et al., 2020)。与受限于单变量时间序列结构的传统机器学习方法不同,GNN 擅长于建模图结构多尺度时间序列(MTS)系统(Deng & Hooi, 2021),广泛应用于社交网络分析、推荐系统、药物发现、交通预测与材料科学等领域(Chen et al., 2020;Papp et al., 2021;Cai et al., 2022;Fritz et al., 2022;Schuetz et al., 2022;Bloemheuvel et al., 2023)。
近年来,GNN 架构也不断涌现创新。Levie et al.(2019)提出基于频谱域卷积架构,采用有理复函数实现频率特异性局部滤波。Shen et al.(2021)提出可扩展的消息传递框架,理论上与分布式优化算法保持置换等变性。Vignac et al.(2020)引入节点唯一标识符的消息传递框架,提升了拓扑属性预测性能。Li X et al.(2021)开发了一种面向功能性核磁共振(fMRI)分析的 GCN 框架,集成 ROI 感知卷积层与透明性提升池化机制。上述文献均表明,GNN 在通过图结构学习复杂关系结构与时空依赖性方面具备优异性能。
基于此,本研究突破传统滑坡变形监测方法的局限,提出基于图神经网络的高级图表示学习方法,将滑坡坡体内全部 GPS 监测点整合为多尺度时间序列系统(MTS),在此基础上,构建集成时间自注意力模块与多尺度自适应图学习策略的改进型图注意力网络(Graph Attention Network, GAT)架构,全面捕捉滑坡变形过程中的复杂时空演化特性。通过三处典型滑坡体监测数据案例验证,结果表明该方法在滑坡变形异质性状态识别的灵敏性与及时性方面表现优异。
本研究的主要创新点包括:
- 构建异质性滑坡变形多尺度时间序列系统(MTS),实现时空域复杂依赖性建模;
- 基于 GAT 模型构建滑坡监测数据图结构,提升监测数据异质性处理能力与监测可靠性;
- 实现基于图层级(graph-level)异质性变形状态识别,为现场工程师提供更具价值的变形监测洞见。
1.2 异质性滑坡变形
异质性滑坡变形源于地质特性与环境动力相互作用下对斜坡稳定性的复杂影响。关键的地质因素包括断层、节理等地质构造,这些结构为差异性位移提供通道,并在薄弱区域集中应力(见图 1)。这些构造特征在不同地貌单元中的差异,导致滑坡空间分布特性及破坏强度存在显著差异。岩性组成同样发挥着重要作用:富含粘土的岩土材料易膨胀,导致孔隙水压力升高,从而降低抗剪强度;而粗粒砂土黏聚力较低但内摩擦角较高,呈现出不同的稳定性演化特性。
环境诱发因素如强降雨、地震活动和人为干扰进一步加剧滑坡变形过程。强降雨会增加孔隙水压力,地震事件则易致斜坡失稳或诱发土体液化。此外,人类活动如滥伐林木、不合理土地利用会破坏天然排水体系,加剧坡面侵蚀,提升滑坡易发性(Tseng et al., 2021)。坡体内薄弱结构面上的差异性应力常导致剪切带和张裂缝的形成(Hoek & Bray, 1974)。当外加应力超过剪切强度时,滑坡体内易在局部形成显著位移和复杂形态的剪切带,并可能垂向贯通(Hungr et al., 2014);而张裂缝则多由与主应力方向垂直的张性破坏形成,通常由差异性运动或外力作用所致(Pathak & Nilsen, 2004)。
地表裂隙与张裂缝是内部应力集中及外界激励作用的重要可视化迹象(Petley, 2012)。强降雨和库水位剧烈波动将升高孔隙水压力,降低有效应力,促使沿薄弱面发生滑移。地震活动则通过强化坡面应力促进裂缝发展。此外,诸如边坡开挖等人为活动改变应力分布,进一步加速张裂缝形成,显著提升滑坡易发性(Fell et al., 2008)。
上述时空变异性揭示了地质结构、应力分布与环境动力之间复杂耦合关系。监测异质性滑坡变形对于动态稳定性评价具有重要意义(Intrieri et al., 2019)。目前,遥感与岩土监测等先进技术可持续追踪剪切带与张裂缝演化过程,实时监测数据有助于滑坡稳定性评价与风险预警,指导防治措施实施(Corominas et al., 2013)。这种监测手段不仅深化了滑坡破坏机制认识,也为高风险区风险管控策略提供有力支撑。
滑坡失稳后将显著改变局地地貌格局,并对周边环境构成严重威胁(Sassa & Canuti, 2008)。滑坡体可能堵塞河道,形成滑坡堰塞湖,扰乱区域水文条件,并增加堰塞湖溃决灾害风险。一旦溃决,大量水体与泥石流将引发突发性洪灾,对下游基础设施与居民区造成巨大破坏。滑坡堰塞湖稳定性受堆积体体积、地形坡度及区域水文状况等因素制约(Casagli et al., 2003),长期可因植被恢复而趋于稳定,或持续侵蚀,形成不同类型的地貌与水环境演变过程。
2 方法论
本节提出一种面向异质性滑坡变形状态监测的多尺度时空方法框架。该方法体系包含四个核心阶段,如图 2 所示:
- 多尺度时间嵌入(temporal embedding)构建
- 图结构学习与构建
- 多尺度时序预测
- 性能评价与聚合
本方法框架旨在同时提取图层级与节点层级的时序依赖结构,并确保图构建过程的合理性验证与可解释性,从而为滑坡变形监测提供鲁棒、可解释的模型方案。
2.1 问题建模
针对异质性滑坡变形过程状态监测,建立正常行为模型至关重要。由于滑坡坡体布设有多个监测传感器,其变形过程可视作多尺度时间序列(Multi-scale Time Series, MTS)系统,即在固定时间间隔采集的多变量观测值集合。在时间域内,预测值与观测值间存在一定偏差,当偏差超过统计阈值时,即视为异常状态。
形式化表示如下:
对于给定滑坡变形 MTS,可表示为:
X = ( x 1 , x 2 , x 3 , ⋯ , x t ) X = (x_1, x_2, x_3, \cdots, x_t) X=(x1,x2,x3,⋯,xt)
其中:
x t = { x 1 , t , x 2 , t , x 3 , t , ⋯ , x N , t } ∈ R N × 1 x_t = \{x_{1,t}, x_{2,t}, x_{3,t}, \cdots, x_{N,t}\} \in \mathbb{R}^{N \times 1} xt={x1,t,x2,t,x3,t,⋯,xN,t}∈RN×1
表示在时间步 t t t 的 N N N 个传感器观测值集合。 x _ t x\_t x_t 表示所有传感器在 t t t 时刻的观测值, x _ i , t x\_{i,t} x_i,t 表示第 i i i 个传感器在 t t t 时刻的观测值。
在正常滑坡变形 MTS 系统中,未来变形值预测可表示为:
x ^ t + h = f ( x 1 , x 2 , x 3 , ⋯ , x t ; h ) \hat{x}_{t+h} = f(x_1, x_2, x_3, \cdots, x_t; h) x^t+h=f(x1,x2,x3,⋯,xt;h)
其中, f f f 表示映射函数, h h h 表示预测步长(Cao et al., 2020)。
考虑滑坡坡体多传感器间空间相关性,可构建**传感器图(Sensor Graph, SG)** 结构,作为滑坡变形 MTS 拓扑特性高质量表达。数学定义如下:
G = { V , E , A } G = \{V, E, A\} G={V,E,A}
其中, V = v _ 1 , v _ 2 , v _ 3 , ⋯ , v _ N V = {v\_1, v\_2, v\_3, \cdots, v\_N} V=v_1,v_2,v_3,⋯,v_N 表示传感器节点集合, E E E 为边集合。若存在 ( v _ i , v _ j ) ∈ E (v\_i, v\_j) \in E (v_i,v_j)∈E,表示第 i i i 和 j j j 号传感器之间存在依赖关系。同时, A ∈ R N × N A \in \mathbb{R}^{N \times N} A∈RN×N 为邻接矩阵,若 ( v _ i , v _ j ) ∈ E (v\_i, v\_j) \in E (v_i,v_j)∈E,则 A _ i , j > 0 A\_{i,j}>0 A_i,j>0,反之 A _ i , j = 0 A\_{i,j}=0 A_i,j=0。
针对 MTS 系统,应学习多图的加权邻接矩阵,以表达丰富隐含的节点间依赖关系(Chen et al., 2023)。因此,式 (1) 可修正为式 (2):
x ^ t + h = f ( x 1 , x 2 , x 3 , ⋯ , x t ; G ; h ) \hat{x}_{t+h} = f(x_1, x_2, x_3, \cdots, x_t; G; h) x^t+h=f(x1,x2,x3,⋯,xt;G;h)
其中, G = G _ 1 , G _ 2 , G _ 3 , ⋯ , G _ t G = {G\_1, G\_2, G\_3, \cdots, G\_t} G=G_1,G_2,G_3,⋯,G_t 表示用于预测模型的时序有向图集合(Cai et al., 2022)。当滑坡变形 MTS 系统异常时,输入预测模型的图 G G G 将导致预测值 x ^ ∗ t + h \hat{x}*{t+h} x^∗t+h 与实际观测值 x ∗ t + h x*{t+h} x∗t+h 之间偏差超出阈值,从而实现异常检测。
2.2 图神经网络(Graph Neural Networks, GNN)
图神经网络(GNN)是一种强大的深度学习网络结构,广泛应用于图结构数据建模任务,能够有效捕捉复杂的图结构关系模式(Deng and Hooi, 2021)。GNN 的基本假设是:某个传感器的状态受到其邻居传感器状态的影响。
在实际应用中,图结构通常包含数量可变、无序排列的传感器节点,且每个传感器节点的邻居数量不同(Chen et al., 2023)。为解决这一问题,GNN 引入了图卷积操作,通过聚合目标节点及其邻居节点的表示(或嵌入)来更新目标节点状态。
设 H ( l ) H^{(l)} H(l) 表示第 l l l 层的传感器嵌入表示,则图卷积操作可表示为:
H ( l + 1 ) = σ ( D ~ − 1 / 2 A ~ D ~ − 1 / 2 H ( l ) W ( l ) ) H^{(l+1)} = \sigma \left( \tilde{D}^{-1/2} \tilde{A} \tilde{D}^{-1/2} H^{(l)} W^{(l)} \right) H(l+1)=σ(D~−1/2A~D~−1/2H(l)W(l))
其中, A ~ = I _ N + A \tilde{A} = I\_N + A A~=I_N+A 表示带自连接的邻接矩阵, D ~ \tilde{D} D~ 为 A ~ \tilde{A} A~ 的对角度矩阵, D ~ ∗ i i = ∑ _ j A ~ ∗ i j \tilde{D}*{ii} = \sum\_j \tilde{A}*{ij} D~∗ii=∑_jA~∗ij(Velickovic et al., 2017)。通过堆叠多层图卷积操作,可实现多阶邻居嵌入信息的聚合。
2.3 时间自注意力模块
如前所述,传感器嵌入 H H H 是 GNN 的输入。传统方法中,通常采用 1D 卷积提取单个传感器时间序列中的时间相关性,随后通过图卷积捕捉不同传感器间的空间相关性。这种方法称为图卷积网络(GCN),已广泛应用于多尺度时间序列预测任务(Wu et al., 2020)。
本研究基于 GNN,引入时间自注意力层,改进了传统 1D 卷积方法,构建了图注意力网络(Graph Attention Network, GAT)(Velickovic et al., 2017)。自注意力机制可高效捕捉多尺度时间序列系统中的时间依赖结构(Xia et al., 2023)。
对给定 MTS,时间自注意力层输入为一个三维张量:
X ∈ R N × T × d t X \in \mathbb{R}^{N \times T \times d_t} X∈RN×T×dt
其中 N N N 为传感器数量, T T T 为时间步长, d _ t d\_t d_t 为通道数。对第 i i i 个传感器,自注意力层输入为:
X i ∈ R T × d t X_i \in \mathbb{R}^{T \times d_t} Xi∈RT×dt
接下来,将 X _ i X\_i X_i 分别映射至查询空间、键空间和值空间:
Q n = X i W q (4) Q_n = X_i W_q \tag{4} Qn=XiWq(4)
K n = X i W k (5) K_n = X_i W_k \tag{5} Kn=XiWk(5)
V n = X i W v (6) V_n = X_i W_v \tag{6} Vn=XiWv(6)
其中, W _ q ∈ R d _ t × d _ k W\_q \in \mathbb{R}^{d\_t \times d\_k} W_q∈Rd_t×d_k、 W _ k ∈ R d _ t × d _ k W\_k \in \mathbb{R}^{d\_t \times d\_k} W_k∈Rd_t×d_k、 W _ v ∈ R d _ t × d _ v W\_v \in \mathbb{R}^{d\_t \times d\_v} W_v∈Rd_t×d_v 均为自注意力模块学习得到的权重矩阵, d _ k d\_k d_k 为投影维度。
基于缩放点积注意力机制,计算传感器间的时间依赖嵌入:
H g = Attention ( Q n , K n , V n ) = softmax ( Q n K n T d k ) V n (7) H_g = \text{Attention}(Q_n, K_n, V_n) = \text{softmax}\left(\frac{Q_n K_n^T}{\sqrt{d_k}}\right) V_n \tag{7} Hg=Attention(Qn,Kn,Vn)=softmax(dkQnKnT)Vn(7)
进一步,通过以下式子计算无向邻接矩阵 A _ g A\_g A_g,表示传感器间总体相似性:
A g = ReLU ( H g , H g T ) (8) A_g = \text{ReLU}(H_g, H_g^T) \tag{8} Ag=ReLU(Hg,HgT)(8)
其中,ReLU 和 softmax 为激活函数(Kong et al., 2022)。
2.4 多尺度自适应图学习
实际上,全局邻接矩阵 A _ g A\_g A_g 仅能反映传感器间的一般相似性,无法衡量随时间变化的局部动态关系。为解决这一问题,本研究如图 3 所示,提出自适应图学习(Adaptive Graph Learning, AGL)策略,将全局邻接矩阵 A _ g A\_g A_g 与基于注意力机制计算的局部邻接矩阵 A _ l A\_l A_l 融合。
局部邻接矩阵 A _ l A\_l A_l 通过增强型注意力机制,根据时间序列输入及传感器自身特征,计算注意力系数 a _ i j a\_{ij} a_ij:
a i j = exp ( LeakyReLU ( c T W X i ∥ W X j ) ) ∑ k ∈ N exp ( LeakyReLU ( c T W X i ∥ W X k ) ) (9) a_{ij} = \frac{\exp(\text{LeakyReLU}(c^T W X_i \| W X_j))}{\sum_{k \in N} \exp(\text{LeakyReLU}(c^T W X_i \| W X_k))} \tag{9} aij=∑k∈Nexp(LeakyReLU(cTWXi∥WXk))exp(LeakyReLU(cTWXi∥WXj))(9)
其中, c T c^T cT 为可学习列向量,LeakyReLU 为非线性激活函数, ∣ | ∣ 表示向量拼接。
最终,通过以下公式融合全局与局部邻接矩阵,得到最终邻接矩阵 A _ AGL A\_{\text{AGL}} A_AGL 和传感器嵌入 H _ AGL H\_{\text{AGL}} H_AGL:
A AGL = A m ( A l + A ~ g ) (10) A_{\text{AGL}} = A_m (A_l + \tilde{A}_g) \tag{10} AAGL=Am(Al+A~g)(10)
H AGL = ( β H g + ( 1 − β ) A AGL H g ) W g (11) H_{\text{AGL}} = \left(\beta H_g + (1 - \beta) A_{\text{AGL}} H_g \right) W_g \tag{11} HAGL=(βHg+(1−β)AAGLHg)Wg(11)
其中, β \beta β 为超参数控制原始状态保留比例, A ~ _ g \tilde{A}\_g A~_g 为归一化后的 A _ g A\_g A_g, W _ g W\_g W_g 为可学习权重矩阵。
2.5 输出层与损失函数
由式(11)得到所有 N N N 个节点的最终表示 H _ AGL H\_{\text{AGL}} H_AGL,可用于预测未来 t + 1 t+1 t+1 至 t + h t+h t+h 时刻的变形值。预测输出 Y _ t + h Y\_{t+h} Y_t+h 计算公式如下:
Y ^ t + h = FC ( Cropping ( H AGL , − h ) ) (12) \hat{Y}_{t+h} = \text{FC}(\text{Cropping}(H_{\text{AGL}}, -h)) \tag{12} Y^t+h=FC(Cropping(HAGL,−h))(12)
其中, FC ( ⋅ ) \text{FC}(\cdot) FC(⋅) 表示全连接操作, Cropping ( ⋅ , − h ) \text{Cropping}(\cdot, -h) Cropping(⋅,−h) 表示从输出序列尾部裁剪长度为 h h h 的序列, Y ^ ∗ t + h = y ^ ∗ t + 1 , y ^ ∗ t + 2 , ⋯ , y ^ ∗ t + h \hat{Y}*{t+h} = { \hat{y}*{t+1}, \hat{y}*{t+2}, \cdots, \hat{y}*{t+h} } Y^∗t+h=y^∗t+1,y^∗t+2,⋯,y^∗t+h, Y _ t + h = y _ t + 1 , y _ t + 2 , ⋯ , y _ t + h Y\_{t+h} = { y\_{t+1}, y\_{t+2}, \cdots, y\_{t+h} } Y_t+h=y_t+1,y_t+2,⋯,y_t+h 为实际观测值。
用于训练图注意力网络与时间自注意力层的损失函数如下:
L loss = L RMSE ( Y t + h , Y ^ t + h ) + λ ( epoch ) L G (13) L_{\text{loss}} = L_{\text{RMSE}}(Y_{t+h}, \hat{Y}_{t+h}) + \lambda(\text{epoch}) L_G \tag{13} Lloss=LRMSE(Yt+h,Y^t+h)+λ(epoch)LG(13)
其中, L _ RMSE L\_{\text{RMSE}} L_RMSE 表示预测值与实际值之间的均方根误差损失, λ ( epoch ) \lambda(\text{epoch}) λ(epoch) 为随训练轮次增加的权重函数, L _ G L\_G L_G 为图结构约束项,其表达式如下:
L G = α X smoothness ( A AGL , X ) + β X connectivity ( A AGL ) + γ X sparsity ( A AGL ) (14) L_G = \alpha X_{\text{smoothness}}(A_{\text{AGL}}, X) + \beta X_{\text{connectivity}}(A_{\text{AGL}}) + \gamma X_{\text{sparsity}}(A_{\text{AGL}}) \tag{14} LG=αXsmoothness(AAGL,X)+βXconnectivity(AAGL)+γXsparsity(AAGL)(14)
其中, α \alpha α、 β \beta β、 γ \gamma γ 为非负超参数, X _ smoothness X\_{\text{smoothness}} X_smoothness、 X _ connectivity X\_{\text{connectivity}} X_connectivity 和 X _ sparsity X\_{\text{sparsity}} X_sparsity 分别表示图平滑性、连通性和稀疏性约束(详细计算方法参见 Kong et al., 2022)。
2.6 现有先进方法 (SOTA Methods)
为展示本文所提出的图注意力网络 (Graph Attention Network, GAT) 框架在滑坡状态监测任务中的优越预测能力,本文对比分析了两类现有先进 (State-of-the-art, SOTA) 时序状态监测方法:点估计型时间序列状态监测方法和多尺度时间序列 (MTS) 状态监测方法。
在点估计型状态监测方法中,通常基于深度学习 (Deep Learning, DL) 或机器学习 (Machine Learning, ML) 模型,对滑坡变形时间序列数据进行分析。例如,基于时间序列预测模型利用历史观测值预测未来变形值,若预测值与实际测值存在显著偏差,则通过控制图检测异常状态。常用的 DL 或 ML 模型包括极限学习机 (Extreme Learning Machine, ELM)、长短期记忆网络 (Long Short-Term Memory, LSTM)、卷积神经网络与 LSTM 集成模型 (Conv-LSTM) 和门控循环单元 (Gated Recurrent Unit, GRU)。
针对多尺度时间序列 (MTS) 状态监测方法,研究者通常检测多传感器采集的时间序列数据之间的相关性,利用图结构方法或重构型方法,学习 MTS 的低维表示,再基于重构误差检测系统异常状态。常见方法包括基于 LSTM 的变分自编码器 (LSTM-VAE)、基于 GRU 的变分自编码器 (GRU-VAE) 和图卷积网络 (Graph Convolutional Network, GCN)。这些方法在学习多传感器数据全局分布特征方面表现优异。
2.7 性能评价指标 (Performance Evaluation Metrics)
在状态监测任务中,评价预测区间 (Prediction Intervals, PIs) 质量与可靠性的重要指标包括平均绝对误差 (Mean Absolute Error, MAE)【公式 (15)】、平均绝对百分比误差 (Mean Absolute Percentage Error, MAPE)【公式 (16)】、均方根误差 (Root Mean Square Error, RMSE)【公式 (17)】以及命中率 (Hit Rate, HR)【公式 (18)】(Li et al. 2020):
MAE = 1 h ∑ i = 1 h ∣ y ^ t + i − y t + i ∣ \text{MAE} = \frac{1}{h} \sum_{i=1}^{h} \left| \hat{y}_{t+i} - y_{t+i} \right| MAE=h1i=1∑h∣y^t+i−yt+i∣
MAPE = 1 h ∑ i = 1 h ∣ y ^ t + i − y t + i ∣ y t + i \text{MAPE} = \frac{1}{h} \sum_{i=1}^{h} \frac{\left| \hat{y}_{t+i} - y_{t+i} \right|}{y_{t+i}} MAPE=h1i=1∑hyt+i∣y^t+i−yt+i∣
RMSE = 1 h ∑ i = 1 h ( y ^ t + i − y t + i ) 2 \text{RMSE} = \sqrt{ \frac{1}{h} \sum_{i=1}^{h} \left( \hat{y}_{t+i} - y_{t+i} \right)^2 } RMSE=h1i=1∑h(y^t+i−yt+i)2
HR = 1 h ∑ i = 1 h I ( i ) \text{HR} = \frac{1}{h} \sum_{i=1}^{h} I(i) HR=h1i=1∑hI(i)
其中, h h h 表示每个传感器预测的步长, I ( i ) I(i) I(i) 为二值指示函数,定义如下【公式 (19)】:
I ( i ) = { 1 , if ∣ y ^ t + i − y t + i ∣ y t + i ≤ 0.1 0 , if ∣ y ^ t + i − y t + i ∣ y t + i > 0.1 I(i) = \begin{cases} 1, & \text{if } \frac{\left| \hat{y}_{t+i} - y_{t+i} \right|}{y_{t+i}} \leq 0.1 \\ 0, & \text{if } \frac{\left| \hat{y}_{t+i} - y_{t+i} \right|}{y_{t+i}} > 0.1 \end{cases} I(i)={1,0,if yt+i∣y^t+i−yt+i∣≤0.1if yt+i∣y^t+i−yt+i∣>0.1
其中,平均绝对误差 (MAE) 衡量预测值与实际值之间误差的平均大小,反映整体预测准确性。平均绝对百分比误差 (MAPE) 将该平均误差标准化为百分比形式,便于跨不同量纲模型的比较。均方根误差 (RMSE) 计算预测值与实际值偏差的平方均值开方,对较大预测误差更为敏感,突出模型严重偏差情况。命中率 (HR) 表示预测值落入实际值区间的比例,衡量预测区间可靠性。
2.8 实地调查与数据采集 (Field Investigation and Data Collection)
为验证本文所提出深度学习框架的有效性,选取中国三峡库区内三处典型滑坡现场位移监测数据进行实验。图 4 所示,监测滑坡包括白水河滑坡、Muyubao滑坡和Shuping滑坡,均位于长江沿岸。上述库水诱发滑坡因其变形机制复杂及灾害影响显著,已在多篇学术文献中被广泛报道。
三处滑坡详细情况如下:
Muyubao滑坡:面积约 1.80 km 2 1.80 \ \text{km}^2 1.80 km2,滑体体积约 900 × 10 4 m 3 900 \times 10^4 \ \text{m}^3 900×104 m3,地形高程 120 ∼ 425 m.a.s.l. 120 \sim 425 \ \text{m.a.s.l.} 120∼425 m.a.s.l.,平均坡度 15 ∘ 15^\circ 15∘,岩性以碳质粉砂岩、石英砂岩为主。主要变形诱因包括降雨与库水位波动。监测体系包含 8 组数据集,图 5(a,b) 展示监测点布置及对应变形观测数据。
白水河滑坡:距三峡大坝约 60 公里,面积 0.42 km 2 0.42 \ \text{km}^2 0.42 km2,高程 75 ∼ 390 m.a.s.l. 75 \sim 390 \ \text{m.a.s.l.} 75∼390 m.a.s.l.,滑体体积 126 × 10 4 m 3 126 \times 10^4 \ \text{m}^3 126×104 m3。呈扇形滑动特征,裂缝发育,变形显著,平均坡度 30 ∘ 30^\circ 30∘,滑带厚度 30 米,主要岩性为煤层、砂岩及泥岩。2014 年 8 月发生大规模变形,导致 85 名居民紧急撤离,降雨与库水位变化是主要触发因素。配备 11 组数据集,图 5(c,d) 给出监测点与变形数据。
Shuping滑坡:位于沙镇溪镇,面积 0.55 km 2 0.55 \ \text{km}^2 0.55 km2,高程 60 ∼ 470 m.a.s.l. 60 \sim 470 \ \text{m.a.s.l.} 60∼470 m.a.s.l.,滑体体积 275 × 10 4 m 3 275 \times 10^4 \ \text{m}^3 275×104 m3,地质组成以砂岩、泥岩、灰岩为主。自 2004 年 2 月以来,滑坡持续发生变形,主要诱因为水位变化。2004 年 5 月因严重不稳定,撤离 580 名居民,涉及 163 户。现配备 9 组监测数据,图 5(e,f) 展示相关信息。
3. 实验结果
3.1 实验设置
为了评估所提方法在实测数据集上的有效性,本文采用第4节所述三个滑坡区域现场监测的位移数据。将所提出的基于图注意力网络(Graph Attention Network, GAT)滑坡变形监测方法与当前主流的点估计方法(OP-ELM、LSTM、Conv-LSTM 和 GRU)及多变量时间序列(MTS)方法(LSTM-VAE、GRU-VAE 和 GCN)进行对比,具体如表1所示。三个区域的时序数据分别包含 115 条、80 条和 163 条月度监测记录。为保持时间相关性,数据集按时间顺序划分为训练/验证集(70%)和测试集(30%)。
本研究采用四个评价指标来评估预测精度,包括 MAE(公式(15))、MAPE(公式(16))、RMSE(公式(17))和 HR(命中率,公式(18))。所有方法均应用 Walk-Forward 验证方式以减缓过拟合问题。模型基于 Python 3.9 编写,图神经网络部分基于 PyTorch 1.10.0 和 PyTorch Geometric 2.6.1 实现,数据处理和可视化使用 NumPy 2.0.2、Pandas 2.2.2、Scikit-learn 1.6.1 和 Matplotlib 3.10.0。所有代码在 Windows 10 系统、Intel Core i5-6500 @ 3.6 GHz CPU 和 16 GB 内存的 PC 上,通过 PyCharm 2024.3.5 Professional Edition 开发与运行。
3.2 超参数调优
合理配置超参数对最大化所提框架性能至关重要。GAT 模型包含多个加权项需要精细调节以在图结构学习与预测精度之间实现平衡。经架构分析确定,超参数 l l l、 a a a 和 b b b 对性能影响最大。本研究采用系统化网格搜索(grid-search)方式而非随机搜索或贝叶斯优化,主要因其在灾害监测应用中的可复现性和参数空间的穷尽性。
根据初步实验及相关文献(Kong et al. 2022;Chen et al. 2023)建议,将超参数搜索区间设定为 KaTeX parse error: Undefined control sequence: \[ at position 1: \̲[̲0.2, 1.0],步长为 0.2 0.2 0.2,保证参数搜索粒度和计算效率的平衡。每组参数配置通过收敛轮次和损失函数值进行评估。表2列出了该参数灵敏性分析结果。
其中,正则化权重 l l l 随数值增大,模型性能改善,最佳值出现在 l = 1.0 l=1.0 l=1.0,此时模型在50个 epoch 内收敛,最终损失值最低(0.25)。图平滑项权重 a a a 在 a = 0.2 a=0.2 a=0.2 时表现最佳,过高值将导致过度平滑,影响模型性能。图连通性项权重 b b b 最优值为 0.4 0.4 0.4,过高会导致泛化能力下降。最终确定 l = 1.0 l=1.0 l=1.0、 a = 0.2 a=0.2 a=0.2、 b = 0.4 b=0.4 b=0.4、 c = 0.4 c=0.4 c=0.4。学习率、batch size 和网络深度等超参数在预实验中影响较小,故采用文献推荐的标准值。
图6展示了 GAT 模型在 Muyubao、Baishuihe 和 Shuping 三个滑坡数据集上的训练与验证损失曲线。损失函数综合了回归损失(RMSE)与图结构约束项(平滑性、连通性和稀疏性)。曲线显示模型在前50个 epoch 内迅速收敛,训练与验证损失趋势一致,说明模型具备良好的泛化能力,无明显过拟合现象。
3.3 滑坡变形预测
表3–表6 汇总了各方法在三组数据集(Muyubao、Baishuihe、Shuping)累计变形预测性能,评价指标为 MAE、MAPE、RMSE 和 HR,分别统计验证集与测试集阶段均值。
结果显示,所提出的 GAT 模型在所有指标上均优于其他方法。
- MAE(表3):验证集 71.94、99.08 和 71.10,测试集 91.97、137.67 和 164.66,均为最低。
- MAPE(表4):验证集最低为 0.05 和 0.06,测试集最高不超过 0.10。
- RMSE(表5):尤其在 Muyubao 数据集表现优异,验证集 73.87,测试集 87.48。
- HR(表6):验证集命中率分别达 0.92、0.95 和 0.97,测试集亦维持高值。
综合来看,GAT 模型不仅预测误差最小,而且验证了图注意力机制在提升滑坡变形预测精度方面的有效性。相关性能指标结果见图6。
3.4 图结构表示
图7展示了基于图注意力网络(Graph Attention Network, GAT)在三处滑坡区域学习得到的监测点图结构,分别对应:(a) Muyubao、(b) Baishuihe 和 © Shuping。图中每个节点代表一个GPS监测点,节点编号已标注。该网络基于各滑坡区域正常工况下观测到的变形数据,捕捉了节点间的空间关系与依赖性。这种学习得到的结构反映了监测点之间复杂的空间耦合特性,有助于理解滑坡变形的动力学过程。
该图结构能够同时建模局部和全局的相互作用,使 GAT 有效表征不同滑坡区域内的变形行为与依赖性。这种方式提升了模型在预测累计位移时的能力,利用监测点之间的相互影响,充分体现滑坡变形空间异质性背景下的时空特性。
3.5 节点级变形监测
异质性滑坡变形的节点级监测结果如图8所示,展示了所提出 GAT 模型在三处滑坡区域:(a) Muyubao、(b) Baishuihe 和 © Shuping 中各监测点累计变形预测的平均绝对百分比误差(MAPE)。
在预测初期,各监测点的 MAPE 值普遍较低,表明这些区域内变形较为均匀,模型能够稳定捕捉整体变形趋势。随着预测时长增加,部分监测点的 MAPE 值逐渐升高,尤其是在 Baishuihe 和 Shuping 滑坡体中。这一现象反映了随着时间推移,局部环境或地质条件的变化导致滑坡变形空间异质性增强。
部分节点预测误差增大的现象,突显了在复杂滑坡环境下维持单点预测精度的挑战,也表明模型对非均匀变形趋势具有较高敏感性。这进一步强调了开展图级监测的重要性,以提升异质性滑坡区域长期变形预测的准确性。
3.6 图级变形监测
为全面掌握多监测点之间的时空关系以及滑坡形变演化的异质性特征,本研究基于构建的正常工况模型,提出图级变形监测方法,其监测流程如图9所示。当全局 MAPE 超过统计阈值并持续两个月以上,即触发报警。全数据集(包括训练、验证和测试阶段)均执行全局预测与误差计算,确定图级阈值。
随后,Muyubao、Baishuihe 和 Shuping 三个滑坡区域的图级监测结果依次绘制于图9–图11中,按时间顺序展示。
如图9所示,初期所有节点处于正常状态(蓝色),表明坡体稳定。第39个月,节点10的 MAPE 超过阈值,触发首次报警,节点被标记为异质性状态(红色)。进入报警状态后,节点10与邻近节点之间的空间依赖性结构失效。第72个月,该状态被判定为异质性变形状态,并出现红色箭头,表示异质性变形沿空间路径传播。
图10呈现 Baishuihe 滑坡监测网络演化过程,滑坡区域由正常状态逐渐过渡为异质性变形状态。第64个月,多数节点转为异质性状态,报警态势加剧。第72个月,节点23、24、…、29 等监测点的空间依赖结构全部失效,区域内判定为异质性变形状态。
图11所示为 Shuping 滑坡监测网络演化,初期所有监测点均处于正常状态(蓝色)。第56个月,节点40 首次超阈值,触发报警,节点变为红色。第71个月,异质性变形进一步蔓延,红色箭头显示变形向邻近监测点扩展,表明坡体上部 ZG87 监测点及其周边区域形成异质性变形模式。
4. 讨论
4.1 时间延迟与收敛轮次
本研究还对应用于滑坡变形时间序列建模的多种机器学习与深度学习模型的时间延迟和收敛轮次进行了对比分析。测试对象涵盖点预测算法(预测单个时间序列)与多维时间序列(MTS)算法。表7汇总了各模型的计算时间延迟及收敛轮次数。
在点预测模型中,OP-ELM 由于采用单次学习策略,训练时间最短,延迟为 0.52–0.68 分钟。相比之下,LSTM、GRU 和 Conv-LSTM 的训练时间略长,尤其是 Conv-LSTM 由于卷积层的引入,耗时可达 1.38 分钟。在收敛轮次方面,LSTM、GRU 和 Conv-LSTM 需要 75–286 个 epoch 才能收敛,GRU 因架构简化,表现出更快的收敛速度。
在多维时间序列模型中,LSTM-VAE 和 GRU-VAE 由于结合递归与变分编码结构,训练时间显著增加,LSTM-VAE 训练耗时最高达 41.80 分钟,收敛轮次数在 161–347 之间。GCN 与 GAT 模型训练时间适中,分别为 11.66–18.55 分钟,收敛轮次数在 179–474 之间。
4.2 不同预测步长下的预测性能
为评估所提出 GAT 模型在不同预测步长下的性能,本文设计了额外实验,分析预测步长从 1 到 20 步时模型表现的变化趋势。采用均方根误差(RMSE)、平均绝对百分比误差(MAPE)和 F1 值三项指标,全面衡量模型的预测精度、误差幅度及分类性能。
图12中分别展示了 Muyubao、Baishuihe 和 Shuping 三处滑坡体预测性能的变化趋势。结果表明,随着预测步长的增加,RMSE 和 MAPE 均稳步上升,说明长期预测难度加大,误差逐渐累积。尤其在预测步长较长时,RMSE 增幅明显。相比之下,F1 值在各预测步长下保持稳定,表明模型始终能有效捕捉关键变形模式,具备良好的分类识别能力。
总体来看,GAT 模型兼具短期高精度预测能力与长期预测稳定性,具备滑坡变形预警场景下良好的应用潜力。
4.3 与相关方法对比
本研究提出的 GAT 方法在滑坡变形监测任务中,相较于现有方法表现出多方面优势。与传统的 LSTM、GRU 等主要依赖单点时间序列预测的深度学习方法不同,本文方法能够同时捕捉多监测点之间复杂的空间依赖性。
与 Khalili 等(2023)提出的图卷积网络(GCN)模型相比,本方法在三处滑坡案例中均取得更优预测精度,得益于集成了时间自注意力机制。这与 Nava 等(2023)关于注意力机制优于传统递归模型捕捉非线性滑坡变形特征的结论相一致。
此外,与 Deng 和 Hooi(2021)依赖固定图结构的图卷积模型不同,本文提出的自适应图学习策略可动态调整监测点间的空间关系,更有效应对滑坡变形异质性演化过程。多尺度时间嵌入策略在本研究中也与 Li H 等(2021)提出的多尺度特征提取方法类似,但本方法进一步扩展至空间域,提升了变形模式检测能力。
尽管 Wu 等(2020)曾在其他时序预测任务中探索过基于图的方法,但本研究针对滑坡监测独特需求,专门引入领域约束及图级预警机制,显著提升模型的实用性和灾害预警效能。
4.4 局限性
尽管本文 GAT 框架在滑坡变形监测中表现优异,但仍存在若干局限性值得关注。首先,模型性能高度依赖于 GPS 监测点布设的密度和空间分布,在监测网络稀疏或分布不均的场景下,预测精度可能受限。
其次,当前模型尚未显式引入降雨强度、地下水位变化及地质条件等外部环境因子,若能纳入上述变量,有望进一步提升复杂地形环境下的预测性能。此外,GAT 算法计算复杂度随监测点数量快速上升,限制了其在大型实时监测网络中的应用扩展性。
最后,模型依赖于历史数据训练,难以识别超越历史观测范围的突发异常或极端变形事件,这在灾害早期预警场景下存在一定风险。
4.5 启示与未来研究方向
本研究在三峡库区三处不同类型滑坡体上的成功应用,验证了所提 GAT 框架具备良好的区域适应性,说明该方法有望推广至其他滑坡易发区域,特别适用于存在稳定监测网络的库岸、降雨集中山区或地质构造复杂、变形异质性显著的地区。
未来可在以下方向开展扩展性研究:
- 融合降雨、地下水及地质参数等环境变量,提升复杂地形条件下的预测性能;
- 探索融合力学原理的物理信息图神经网络(Physics-Informed GNN),增强模型在极端变形场景下的泛化能力;
- 开发轻量化 GAT 算法,实现远程野外监测点实时边缘计算应用。
未来如能在三峡库区以外的多地质环境条件下验证该框架,将有望确立其作为滑坡监测与预警通用方法的广泛适用性。
5. 结论
本文提出了一种基于改进型图注意力网络(GAT)的大型滑坡变形异质性监测方法。该框架集成多尺度时间嵌入与自适应图学习机制,能够有效捕捉监测点之间的时空依赖关系与异质性变形特征。
基于三峡库区真实滑坡数据的实验结果表明,该方法在预测精度上优于现有多种方法,具备灵敏识别异质性滑坡变形状态的能力。
该框架的核心优势在于同时建模节点级与图级变形演化过程,全面反映滑坡动力学特征。时间自注意力机制提升了异常趋势检测与变形传播链识别能力,为滑坡灾害早期预警提供了可靠支撑。自适应图学习机制保证了模型对空间依赖关系变化的动态响应能力,适用于多样复杂滑坡变形场景。
Muyubao、Baishuihe 和 Shuping 三处滑坡案例验证了该方法在异质性变形环境下的稳健性。未来研究可进一步融合环境变量、构建物理信息图神经网络,并开发轻量化实时监测模型,持续拓展图神经网络在滑坡灾害监测与风险防控领域的应用前景。