Neo4j GDS-12-neo4j GDS 库中节点插入（Node Embedding）算法介绍-EW帮帮网

基于随机游走的方法
通过模拟节点间的路径生成序列，借鉴NLP中的序列建模技术（如Word2Vec）：
- 关键假设：共现在同一游走路径的节点具有相似性
- 优势：能捕捉局部和全局结构特征
基于矩阵分解的方法
将邻接矩阵分解为低维矩阵的乘积：
- 典型算法：Laplacian Eigenmaps、Graph Factorization
- 数学基础：保留图拉普拉斯矩阵的特征
基于深度学习的方法
使用神经网络自动学习复杂结构：
- 图神经网络（GNN）：通过消息传递机制聚合邻居信息（如GraphSAGE）
- 深度自编码器：重构输入图结构（如SDNE）
优化算法驱动的方法
直接定义损失函数并通过梯度下降优化：
- 典型代表：LINE算法的一阶/二阶相似度优化

改进点：
引入有偏随机游走策略，通过参数p（返回概率）、q（探索概率）控制BFS/DFS倾向
游走策略：
- 当q>1时偏向BFS（捕捉局部结构）
- 当q<1时偏向DFS（发现社区结构）
数学表达：
转移概率公式：
$P(v_{next}=x|v_{curr}=u) = \frac{w_{ux}\cdot \alpha(p,q)}{\sum_{v\in N(u)} w_{uv}\cdot \alpha(p,q)}$

其中α控制返回/探索倾向

突破性：
提出归纳式学习框架（Inductive Learning），可处理动态图和新节点
核心步骤：
1. 邻居采样：分层采样固定数量邻居（如每层采样10个）
2. 特征聚合：使用均值/LSTM/Pooling函数聚合邻居特征
3. 参数更新：通过下游任务反向传播优化
数学表达：
$h_v^k = \sigma(W^k \cdot \text{AGGREGATE}(\{h_u^{k-1}, \forall u \in N(v)\}))$

其中k表示网络层数

Neo4j GDS-12-neo4j GDS 库中节点插入（Node Embedding）算法介绍