9.9 基于学习域不变模型的WiFi室内定位

发布于:2025-06-26 ⋅ 阅读:(14) ⋅ 点赞:(0)

文献来源:Wang G, Zhang D, Zhang T, et al. Learning domain-invariant model for WiFi-based indoor localization[J]. IEEE Transactions on Mobile Computing, 2024.

本文针对基于WiFi的室内定位中信号处理方法空间分辨率有限、深度学习方法跨域能力不足的问题,提出了一种学习领域不变模型的新框架,通过让神经网络估计以接入点为中心的极坐标、设计波束形成层整合信号处理知识以及采用多任务学习方案,提升了定位精度和跨域性能。实验在多种数据集上表明,该方法优于现有先进方法,在跨域条件下表现出优越性,且释放的数据集将推动相关研究。

 思维导图 

研究背景

- 室内定位应用广泛,WiFi定位因AP普及受关注

- 信号处理方法依赖数学模型但受限于空间分辨率

- 深度学习方法在特定环境表现好但跨域能力差

核心创新

-极坐标输出:避免拟合与环境强相关的AP坐标,利用AP与客户端相对空间关系

- 波束形成层:利用全连接层与波束形成数学本质相同,提升极坐标回归精度

- 多任务学习:同时学习笛卡尔坐标和极坐标特征,提高定位精度和泛化能力

方法设计

- 问题分析:信号处理方法受分辨率和干扰影响,深度学习方法依赖训练环境

 - 网络设计:输入CSI,经波束形成层和ResNet提取特征,分两支回归极坐标和笛卡尔坐标

- 定位过程:极坐标转笛卡尔坐标,结合直接回归结果概率融合

实验验证

 - 数据集:DLoc数据集、自建UWB-WiFi数据集和相机-WiFi数据集 - 对比方法:Co-Loc、DLoc、SpotFi等 - 结果:简单场景中位数误差0.38-0.73m,复杂场景0.64-0.73m,跨域性能显著优于DLoc ## **贡献** - 整合信号处理和深度学习,提出领域不变模型 - 设计波束形成层和多任务学习,提升定位精度 - 实验验证方法优越性,释放数据集推动研究 ```

详细总结 

  • 一、研究背景与目标
  1. **WiFi室内定位现状**:基于CSI的定位方法中,信号处理方法(如估计AoA和ToF进行三角定位)具有跨域能力,但受限于商用WiFi设备的空间分辨率,在复杂环境中性能下降;深度学习方法直接回归客户端坐标,在特定环境表现优异,但过度拟合训练域特征,无法泛化到新环境。
  2. **研究目标**:提出领域不变模型,整合信号处理的跨域能力和深度学习的高精度参数估计能力,实现不同环境下的可靠定位。

 二、核心方法与创新点

  1. **极坐标输出设计**

- 现有深度学习方法将AP坐标隐式拟合为网络参数,导致模型依赖环境;本文让网络输出以AP为中心的极坐标(角度和距离),利用AP与客户端的相对空间关系保持不变性。

  1. **波束形成层** - 发现波束形成与全连接层的数学本质相同(均为矩阵乘法),用全连接层实现波束形成计算,初始化权重矩阵为波束形成的相移矩阵,提升极坐标回归精度。
  2. **多任务学习方案** - 将极坐标和笛卡尔坐标回归作为两个分支,使网络同时学习相对位置和绝对位置特征,结合NLL损失函数优化,提高定位精度和泛化能力。

三、方法详细设计

  1. **网络架构** - 输入:CSI的实部和虚部;输出:极坐标(θ,d)和笛卡尔坐标(x,y)的均值与方差。
  2. - 处理流程:CSI经波束形成层生成空间频谱,作为三通道图像输入ResNet提取特征,通过全连接层分两支回归参数。
  3. **定位过程** - 极坐标转笛卡尔坐标:根据AP坐标和估计的极坐标计算间接笛卡尔坐标。 - 概率融合:结合直接回归的笛卡尔坐标和间接转换结果,基于方差加权融合得到最终定位。

 四、实验验证

  1. **数据集** | 数据集 | 场景 | 特点 |

|---|---|---|

 | DLoc | Atkison Hall(简单)、Jacobs Hall(复杂) | 机器人采集,含LOS和NLOS场景 | | UWB-WiFi | 会议室、办公室、休息室 | 手持设备采集,UWB提供真值 | | 相机-WiFi | 多场景 | 相机视觉算法获取真值,12相机+4 AP |

  1. **对比方法** - 信号处理方法:Co-Loc、SpotFi;深度学习方法:DLoc。 3. **关键结果**

- **简单场景**:如Atkison Hall,本文方法中位数误差0.44m,90th percentile误差0.80m;DLoc分别为0.41m和0.85m,信号处理方法误差超0.88m。

- **复杂场景**:如Office,本文方法中位数误差0.64m,90th percentile误差1.40m;DLoc分别为0.76m和2.79m,信号处理方法误差超1.99m。 - **跨域性能**:训练在Conference,测试在Office,本文方法中位数误差1.55m,DLoc达4.18m。

五、主要贡献

  1. 设计波束形成层,整合信号处理与深度学习,实现领域不变模型。
  2. 提出多任务学习,同时优化极坐标和笛卡尔坐标回归,提升定位精度。 3. 在多数据集上验证方法优越性,释放数据集推动后续研究。

关键问题

  1. 为什么基于WiFi的室内定位需要领域不变模型?

- **答案**:现有深度学习方法过度拟合训练环境中的AP坐标等特征,当部署到新环境时性能大幅下降;而信号处理方法虽具跨域能力,但受限于WiFi设备空间分辨率。领域不变模型通过估计极坐标和整合信号处理知识,避免环境依赖,实现跨域定位。

2.波束形成层在该方法中的作用是什么?

- **答案**:波束形成层利用全连接层与波束形成的数学本质相同(矩阵乘法),将CSI直接输入网络,通过初始化权重为波束形成相移矩阵,融入信号处理知识,提升神经网络对极坐标的回归精度,避免手动特征提取的信息损失。

  1. **问题**:多任务学习如何提升定位性能?

- **答案**:多任务学习将极坐标和笛卡尔坐标回归作为两个分支,极坐标约束网络学习与AP位置无关的相对位置特征,笛卡尔坐标约束学习绝对位置特征,两者结合使模型同时具备高精度定位和跨域能力。实验表明,多任务学习较单任务模型定位误差降低9%-26%。

神经网络估计AP为中心的极坐标是怎么实现的?

神经网络估计AP为中心的极坐标是通过以下步骤实现的:

### 数据输入与预处理

- **输入数据**:神经网络的输入是WiFi信道状态信息(CSI),包括CSI的实部和虚部。这些数据包含了无线信号在不同天线和子载波上的相位和幅度信息。

- **数据预处理**:在将CSI数据输入神经网络之前,进行了归一化处理以消除不同维度之间的量纲差异,并通过相位校准消除AP重启后的相位偏移。

### 网络结构设计

- **波束成形层**:波束成形层是网络的关键部分,用于将CSI数据转换为空间谱。这一层利用了波束成形的数学原理,通过补偿不同天线和频率上的相位偏移,使得来自特定角度和时延的信号能够相干叠加,而其他位置的信号则被抑制。波束成形层的权重矩阵被初始化为波束成形的相移矩阵,从而将信号处理的知识融入到深度学习模型中。

- **特征提取**:在波束成形层之后,将得到的空间谱视为图像,取其实部、虚部和幅度作为图像的三个通道。然后使用ResNet架构进行特征提取,包括1个卷积层和4个ResNet BasicBlock,以提取CSI数据中的空间和频率特征。

- **多任务学习分支**:网络包含两个分支,分别用于回归极坐标和笛卡尔坐标。这种多任务学习的设置使网络能够同时学习同一位置的不同表示,即AP为中心的极坐标和绝对位置的笛卡尔坐标。通过这种方式,网络能够在关注极坐标(相对位置信息)的同时,也学习到笛卡尔坐标(绝对位置信息),从而提高了模型的泛化能力和定位精度。

### 极坐标回归

- **输出层**:在网络的最后几层,使用几个全连接层来回归极坐标和笛卡尔坐标的均值和方差。对于极坐标,输出每个AP的极角和距离;对于笛卡尔坐标,输出x和y坐标。

- **损失函数**:训练过程中,网络使用负对数似然(NLL)损失函数来优化回归结果,该损失函数考虑了预测值的均值和方差,从而使得网络能够输出具有不确定性的位置估计。损失函数综合了极坐标和笛卡尔坐标的损失,以实现多任务学习的目标。

### 定位结果融合

- **极坐标到笛卡尔坐标的转换**:由于不同AP的极坐标系统不同,需要将每个AP的极坐标转换为统一的笛卡尔坐标系。根据几何模型,将极坐标转换为笛卡尔坐标,并利用误差传播理论将极坐标的方差转换为笛卡尔坐标的方差。

- **多AP信息融合**:最后,通过概率融合的方式,将来自不同AP的直接回归的笛卡尔坐标和间接转换的笛卡尔坐标及其对应的方差进行融合,得到最终的客户端位置估计。这种融合方式考虑了不同AP提供的位置信息的置信度,从而提高了定位的准确性和鲁棒性。

主要参考文献

这篇论文的参考文献非常丰富,涵盖了信号处理、深度学习、室内定位、WiFi通信等多个领域。根据论文的内容和重点,以下是一些最重要的参考文献,它们对论文的研究方法、实验设计或理论基础有直接的影响:

### 信号处理相关文献

- **[12] J. Xiong and K. Jamieson, “ArrayTrack: A Fine-grained indoor location system,” in Proc. 10th USENIX Symp. Netw. Syst. Des. Implementation, 2013, pp. 71–84.**

- **[13] M. Kotaru, K. Joshi, D. Bharadia, and S. Katti, “SpotFi: Decimeter level localization using WiFi,” in Proc. ACM Conf. Special Int. Group Data Commun., 2015, pp. 269–282.**

- **[16] S. Yang, D. Zhang, R. Song, P. Yin, and Y. Chen, “Multiple WiFi access points co-localization through joint AoA estimation,” IEEE Trans. Mobile Comput., vol. 23, no. 2, pp. 1488–1502, Feb. 2024.**

- **[27] W. Gong and J. Liu, “RoArray: Towards more robust indoor localization using sparse recovery with commodity WiFi,” IEEE Trans. Mobile Comput., vol. 18, no. 6, pp. 1380–1392, Jun. 2019.**

- **[28] A. B. Pizarro, J. P. Beltrán, M. Cominelli, F. Gringoli, and J. Widmer, “Accurate ubiquitous localization with off-the-shelf IEEE 802.11 AC devices,” in Proc. 19th Annu. Int. Conf. Mobile Syst., Appl., Serv., 2021, pp. 241–254.**

这些文献对论文中信号处理方法的设计和实现提供了理论基础和参考案例,例如ArrayTrack和SpotFi都是经典的信号处理室内定位系统。

### 深度学习相关文献

- **[17] R. Ayyalasomayajula et al., “Deep learning based wireless localization for indoor navigation,” in Proc. 26th Annu. Int. Conf. Mobile Comput. Netw., 2020, pp. 1–14.**

- **[34] X. Wang, X. Wang, and S. Mao, “Deep convolutional neural networks for indoor localization with CSI images,” IEEE Trans. Netw. Sci. Eng., vol. 7, no. 1, pp. 316–327, First Quarter, 2020.**

- **[40] X. Wang, L. Gao, S. Mao, and S. Pandey, “Csi-based fingerprinting for indoor localization: A deep learning approach,” IEEE Trans. Veh. Technol., vol. 66, no. 1, pp. 763–776, Jan. 2017.**

- **[42] B. Zhang, H. Sifaou, and G. Y. Li, “CSI-fingerprinting indoor localization via attention-augmented residual convolutional neural network,” IEEE Trans. Wireless Commun., vol. 22, no. 8, pp. 5583–5597, Aug. 2023.**

这些文献为论文中的深度学习方法提供了技术支持和参考,包括深度学习在无线定位中的应用、基于CSI的深度学习方法和注意力增强的残差卷积神经网络等。

### WiFi通信相关文献

- **[11] Z. Yang, Z. Zhou, and Y. Liu, “From RSSI to CSI: Indoor localization via channel response,” ACM Comput. Surv., vol. 46, no. 2, pp. 1–32, 2013.**

- **[47] D. Halperin, W. Hu, A. Sheth, and D. Wetherall, “Tool release: Gathering 802.11n traces with channel state information,” ACM SIGCOMM Comput. Commun. Rev., vol. 41, no. 1, pp. 53–53, 2011.**

这些文献提供了WiFi信道状态信息(CSI)的收集和处理方法,是论文中数据采集和预处理的重要参考。

### 多任务学习相关文献

- **[52] R. Caruana, “Multitask learning,” Mach. Learn., vol. 28, pp. 41–75, 1997.**

- **[53] S. Liu, E. Johns, and A. J. Davison, “End-to-end multi-task learning with attention,” in Proc. IEEE/CVF Conf. Comput. Vis. Pattern Recognit., 2019, pp. 1871–1880.**

这些文献为论文中的多任务学习方案提供了理论支持和方法指导。

这些参考文献涵盖了信号处理、深度学习、WiFi通信和多任务学习等多个方面,为论文的研究提供了坚实的理论基础和丰富的技术参考。

结合图5,解释文献的框架何流程

5.拟定方法的框架。首先,测量的CSI被馈送到神经网络并由波束形成层处理,随后通过编码器进行特征提取。然后,网络利用解码器分别回归极坐标和笛卡尔坐标。最后,本地化阶段会整合多个信息来源以进行定位。对于每个Conv 2d,所示的四个值是[内核高度、内核宽度、跨距、填充],编码器块中的黑色数字指示内核的数量。而对于每个线性层,两个关键值是[input-dimension,output-dimension]。

图5展示了论文中提出的方法的整体框架和流程,以下是详细的解释:

### 框架概述

整个框架可以分为四个主要部分:**数据输入**、**波束成形层**、**特征提取与多任务学习**和**定位结果融合**。

### 详细流程

#### 1. 数据输入

- **输入数据**:框架的输入是WiFi的信道状态信息(CSI),具体包括CSI的实部和虚部。这些数据包含了无线信号在不同天线和子载波上的相位和幅度信息。

- **数据预处理**:在输入神经网络之前,CSI数据经过归一化处理和相位校准,以消除不同维度之间的量纲差异和AP重启后的相位偏移。

#### 2. 波束成形层

- **波束成形计算**:波束成形层是框架的核心部分之一,其作用是将CSI数据转换为空间谱。这一层利用了波束成形的数学原理,通过补偿不同天线和频率上的相位偏移,使得来自特定角度和时延的信号能够相干叠加,而其他位置的信号则被抑制。

- **初始化权重矩阵**:波束成形层的权重矩阵被初始化为波束成形的相移矩阵,从而将信号处理的知识融入到深度学习模型中。这种初始化方式使得网络能够更好地利用先验知识,提高模型的性能。

#### 3. 特征提取与多任务学习

- **特征提取**:在波束成形层之后,将得到的空间谱视为图像,取其实部、虚部和幅度作为图像的三个通道。然后使用ResNet架构进行特征提取,包括1个卷积层和4个ResNet BasicBlock,以提取CSI数据中的空间和频率特征。

- **多任务学习分支**:网络包含两个分支,分别用于回归极坐标和笛卡尔坐标。这种多任务学习的设置使网络能够同时学习同一位置的不同表示,即AP为中心的极坐标和绝对位置的笛卡尔坐标。通过这种方式,网络能够在关注极坐标(相对位置信息)的同时,也学习到笛卡尔坐标(绝对位置信息),从而提高了模型的泛化能力和定位精度。

- **输出层**:在网络的最后几层,使用几个全连接层来回归极坐标和笛卡尔坐标的均值和方差。对于极坐标,输出每个AP的极角和距离;对于笛卡尔坐标,输出x和y坐标。

#### 4. 定位结果融合

- **极坐标到笛卡尔坐标的转换**:由于不同AP的极坐标系统不同,需要将每个AP的极坐标转换为统一的笛卡尔坐标系。根据几何模型,将极坐标转换为笛卡尔坐标,并利用误差传播理论将极坐标的方差转换为笛卡尔坐标的方差。

- **多AP信息融合**:最后,通过概率融合的方式,将来自不同AP的直接回归的笛卡尔坐标和间接转换的笛卡尔坐标及其对应的方差进行融合,得到最终的客户端位置估计。这种融合方式考虑了不同AP提供的位置信息的置信度,从而提高了定位的准确性和鲁棒性。

### 损失函数与训练

- **损失函数**:训练过程中,网络使用负对数似然(NLL)损失函数来优化回归结果,该损失函数综合了极坐标和笛卡尔坐标的损失,以实现多任务学习的目标。

- **训练细节**:模型使用PyTorch框架实现,激活函数为ReLU,dropout率为0.2。训练 epoch 为25,batch size为256,使用Adam优化器,学习率为0.01,并通过指数衰减调整学习率。

### 总结

整个框架通过结合信号处理和深度学习的优势,实现了跨域不变的WiFi室内定位模型。波束成形层和多任务学习方案是框架的核心创新点,分别用于提高模型的定位精度和泛化能力。通过在多个数据集上的实验验证,该框架在定位精度和跨域性能方面均优于现有的方法。

文章使用的数据集是什么?数据集的构成要素?

文章使用了三个不同的数据集进行实验,这些数据集分别用于评估所提方法在不同室内环境下的性能。以下是每个数据集的详细介绍:

### 1. DLoc 数据集

- **介绍**:DLoc 数据集引入了同时定位与建图(SLAM)技术,用于实现基于深度学习的室内定位数据的自动和高精度采集。

- **构成要素**:

  - **场景**:包含两个场景,一个是简单的视距(LOS)场景,另一个是高多径和非视距(NLOS)场景。

  - **数据采集**:使用机器人进行数据采集,机器人在室内环境中移动,同时记录WiFi CSI数据和位置信息。

  - **数据格式**:数据以 CSI 的实部和虚部形式存储,并提供了机器人的位置信息。

  - **数据量**:每个场景有不同的设置,数据量较大,能够全面评估定位方法的性能。

### 2. 人手持设备数据集(基于UWB和WiFi)

- **介绍**:该数据集基于超宽带(UWB)和WiFi技术构建,提供了UWB的2D笛卡尔坐标真值。

- **构成要素**:

  - **场景**:数据集包含多个场景,涵盖了不同的室内环境,如会议室、办公室和休息室。

  - **数据采集**:使用UWB设备提供精确的位置真值,同时采集WiFi CSI数据。数据采集过程中,志愿者手持WiFi设备在室内环境中移动。

  - **数据格式**:数据包括WiFi CSI的实部和虚部,以及UWB提供的位置真值。

  - **数据量**:数据量丰富,能够反映真实世界中人体运动对WiFi信号的影响。

### 3. 相机-WiFi数据集

- **介绍**:该数据集通过相机-WiFi数据采集系统收集,利用计算机视觉算法从相机数据中获取位置真值。

- **构成要素**:

  - **场景**:包含多个场景,如会议室、办公室和休息室等,每个场景的布局和环境各不相同。

  - **数据采集**:使用12个摄像头和4个WiFi接入点(AP)进行数据采集。摄像头用于获取位置真值,WiFi AP用于采集CSI数据。

  - **数据格式**:数据包括WiFi CSI的实部和虚部,以及从相机数据中提取的位置真值。

  - **数据量**:数据量较大,能够评估模型在不同环境下的性能。

### 数据集的共同构成要素

- **WiFi CSI数据**:所有数据集都包含WiFi信道状态信息(CSI),包括CSI的实部和虚部,这些数据用于训练和测试定位模型。

- **位置真值**:每个数据集都提供了位置真值,用于评估定位模型的准确性。位置真值的获取方式因数据集而异,包括机器人SLAM、UWB设备和相机视觉算法。

- **环境信息**:数据集包含了室内环境的布局和特征信息,如AP的位置、环境中的障碍物和反射面等。

- **多样性和复杂性**:数据集涵盖了不同的室内环境和场景,包括简单的LOS环境和复杂的NLOS环境,以及不同的人体运动模式和干扰因素。

这些数据集的多样性和丰富性为评估所提方法在不同环境下的性能提供了坚实的基础。通过在这些数据集上的实验,文章验证了所提方法在定位精度和跨域性能方面的优越性。

图5可以看到编码器之后分为两个支路的解码器相连,这个是自编码器的结构吗?

从图5来看,编码器之后分为两个支路的解码器相连,这种结构确实类似于自编码器的结构,但不完全是自编码器。以下是对这种结构的详细解释:

### 自编码器的基本结构
自编码器是一种无监督学习模型,通常由编码器和解码器组成。其主要目的是将输入数据通过编码器映射到一个低维的隐空间,然后再通过解码器将低维表示还原为原始数据。自编码器的结构通常是对称的,编码器和解码器的神经元数量逐渐减少和增加。

### 文献中的结构
- **编码器**:在文献的框架中,编码器部分负责提取输入CSI数据的特征。它由一个卷积层和四个ResNet BasicBlock组成,用于学习数据中的复杂模式和特征。
- **解码器**:编码器之后分为两个支路的解码器,这两个支路分别用于回归极坐标和笛卡尔坐标。这种设计属于多任务学习,每个支路的解码器都是独立的,分别学习不同的表示。
- **不对称结构**:与典型的自编码器不同,这里的解码器部分不是对称的,其目的是进行多任务学习,而不是将数据还原为原始输入形式。

### 关键区别
- **目标不同**:自编码器的目标是学习数据的压缩表示并尽可能准确地重建输入,而文献中的框架目标是进行定位,即输出位置坐标。
- **输出不同**:自编码器的输出与输入具有相同的维度,而文献中的框架输出的是位置坐标(极坐标和笛卡尔坐标),与输入的CSI数据维度不同。

所以,虽然文献中的框架在编码器之后使用了两个支路的解码器,这在表面上类似于自编码器的结构,但其实质和目标与自编码器不同。它属于多任务学习的深度神经网络架构,旨在同时学习位置的两种不同表示。


网站公告

今日签到

点亮在社区的每一天
去签到