PairRE: Knowledge Graph Embeddings via Paired Relation Vectors(论文笔记)

发布于:2025-03-23 ⋅ 阅读:(26) ⋅ 点赞:(0)

CCF等级:A

发布时间:2020年11月

25年3月24日交

目录

一、简介

二、原理

1.整体

2.关系模式

3.优化模型

三、实验性能

四、结论和未来工作


一、简介

将RotatE进行生级,RotatE只对头实体h进行计算,PairRE对头尾实体都进行计算。


二、原理

1.整体

PairRE​​​

PairRE评分函数:

f_r(h,t) = -||h\circ r_H - t \circ r_T||

每个关系 r 都由一对向量[r_H,r_T] 来表示,意味着知识图谱中的每一个关系,都会有一组特定的头向量r_H和尾向量r_T与其对应。当同一个关系 r 在不同的三元组中出现时,它使用相同的 r_Hr_T向量。提高了向量的利用率,并在一定程度上增加了模型的解释性。

2.关系模式

PairRE可以处理1-to-N、N-to-1、N-to-N这种复杂关系。因为PairRE将关系转化为向量对,因此可以处理对称/反对称关系、逆关系、编码组合关系、子关系。

  • 对称关系:例如“朋友”关系。如果 e1 是 e2 ​的朋友,那么 e2 也是 e1 的朋友。这可以用三元组表示为:(e1,朋友,e2)∈T⇔(e2,朋友,e1)∈T。
  • 反对称关系:例如“父亲”关系。如果 e1​ 是 e2 的父亲,则 e2​不可能是 e1 ​的父亲。这可以用三元组表示为:(e1,父亲,e2)∈T⇒(e2,父亲,e1)∉T。
  • 逆关系:例如“父亲”,“儿子”关系。如果 e1 是 e2 ​的父亲,则 e2​是 e1 ​的儿子。这可以用三元组表示为: (e1,父亲,e2)∈T,则有 (e2,儿子,e1)∈T。
  • 组合关系:例如“母亲的父亲”和“祖父”之间的关系。如果 e1 是 e2​ 的母亲,并且 e2 是 e3​ 的父亲,则实体 e1 是实体 e3的祖父。这用三元组表示为:
    (e1,母亲,e2)∈T并且 (e2,父亲,e3)∈T,则有 (e1,祖父,e3)∈T。
  • 子关系:例如“父亲”和“家长”关系。如果 e1 是 e2 的父亲,则 e1 是 e2 的家长。这用三元组表示为:(e1,父亲,e2)∈T⇒(e1,家长,e2)∈T。

给定一个关系 r ,计算每个头实体的平均尾实体数(tphr)和每个尾实体的平均头实体数(hptr)。

  • tphr<1.5tphr<1.5,则关系r1-to-1
  • tphr>1.5tphr>1.5,则关系r1-to-N
  • tphr>1.5tphr<1.5,则关系rN-to-N

3.优化模型

PairRE模型利用了自对抗负采样损失来优化模型。具体来说,该方法的目的是通过最大化正样本的得分同时最小化负样本的得分来训练模型。以下是PairRE使用负采样进行优化的具体步骤和公式:

L=-\log\sigma (\gamma -f_r(h,t))-\Sigma_{i=1}^{n}\rho (h_{i}^{'},r,t_{i}^{'})\log\sigma (f_r(h_{i}^{'},t_{i}^{'})-\gamma )

其中:

  • \gamma是一个固定边界值。
  • \sigma是Sigmoid函数。
  • (h_{i}^{'},r,t_{i}^{'})表示第 i 个负样本三元组。
  • \rho (h_{i}^{'},r,t_{i}^{'})表示负样本的权重,其计算方式为:

\rho ((h_{i}^{'},r,t_{i}^{'})|(h,r,t))=\frac{\exp(f_r(h_{i}^{'},t_{i}^{'}))}{\sum_{j} \exp(f_r(h_{j}^{'},t_{j}^{'}))}

三、实验性能

 表 3 展示了 ogbl-wikikg2 和 ogbl-biokg 的对比情况。在这两个大规模数据集上,PairRE 达到了最先进的性能。对于 ogbl-wikikg2 数据集,PairRE在有限嵌入维度和增加嵌入维度的情况下均表现最佳。在参数数量与 ComplEx 相同(维度为 100)的情况下,PairRE测试 MRR 提升了近 10%。

表 4 展示了 FB15k 和 FB15k-237 数据集的对比情况。由于PairRE模型与 RotatE 共享相同的超参数设置和实现方式,因此与这一最先进的模型进行比较是公平的,能够展示所提出模型的优势和不足。

文章将 RotatE 中的关系向量改为成对向量。在修改后的 RotatE 模型中,头实体和尾实体均基于成对向量以不同的角度进行旋转该模型也可以被视为基于复数值的PairRE。文章将此模型命名为 RotatE+PairRelation。实验结果如图 2 所示。在相同的嵌入维度(实验中为 50)下,RotatE+PairRelation 在 1 对1、1 对 N、N 对 1 和 N 对 N 关系类别上分别将RotatE 的性能提高了 20.8%、27.5%、14.4% 和39.1%。这些显著的改进证明了成对关系向量处理复杂关系的优越能力。

四、结论和未来工作

  1. 提高计算效率
  2. 增强关系模式表达能力
  3. 结合其他先进技术(如神经网络)
  4. 深入研究“RotatE+PairRelation”