学习笔记 - 知识图谱的符号表示方法

发布于:2024-09-17 ⋅ 阅读:(49) ⋅ 点赞:(0)

学习笔记 - 知识图谱的符号表示方法

说明:

  • 首次发表日期:2024-09-13
  • 个人阅读学习并摘录成笔记

知识表示的相关名词定义

以下内容摘录自 Knowledge Graphs Applied 2.3小节,然后AI翻译+人工润色。

  • 实体(Entities)—表示知识的核心概念,其他所有东西都是围绕其构建的。
    • 实体可以是物理实体(如化合物、疾病、患者、地点),也可以是抽象实体(如想法(idea)、情绪(sentiments)等概念)。
      实体可以具有不同的属性,如人名、城市的地理位置等。它们是知识库中的“一级公民”,因为它们代表了整个知识库创建的原子信息(atomic information)。
  • 关系(Relationships)—定义实体之间的关系。例如,一个城市属于某个地区,一个基因编码一种蛋白质,一种疾病有某些症状等。关系可以具有属性,如日期、描述、概率等。
  • 本体(Ontologies)—定义特定领域的知识中存在的实体和关系类型,以及他们拥有的属性。
    例如,通过本体论和分类法(taxonomies),你可以定义实体的层级表示(hierarchical representation)(如医疗或教育机构),或者定义其属性(如一个组织必须有一个创始人、一个地址和一个伦理政策)。你可以确定这些属性的基数(Cardinality)(如一个组织可以有多个创始人和地址,但必须有一个唯一的伦理政策),或者定义组织内关系的性质(如传递性(transitivity),这意味着你的老板的老板也是你的老板)。
  • 目标和效用(Goals and utilities)—定义世界期望的和不期望的状态和代理的状态(states of agents)。在我们的医疗系统中,这些可能是身体的温度的降低(期望结果)或升高(不期望结果),患者运动功能的改善,红斑减少,血氧饱和度提升,等等。
  • 策略、控制规则和启发(Policies, control rules, and heuristics)—规定行动方式(Prescribe ways of acting)。例如,在开处方前检查患者是否对对乙酰氨基酚过敏,询问患者是否服用了化合物 X X X,因为它可能影响化合物 Y Y Y的效力等。

属性图

以下内容摘录自知识图谱导论 2.3.2小节。

属性图是图数据库Neo4J实现的图结构表示模型。

在属性图的术语中,属性图是由顶点(Vertex)​、边(Edge)​、标签(Label)​、关系类型和属性(Property)组成的有向图。

顶点(Vertex)也称为节点(Node)​,边(Edge)也称为关系(Relationship)​。

在属性图中,节点(Vertex/Node)和关系边(Edge/Relationship)是最重要的表达要素。节点上包含属性,属性可以以任何键值形式存在。

关系边(Edge/Relationship)连接节点(Vertex/Node),每条关系边都有拥有一个方向、一个标签、一个开始节点和一个结束节点。

关系边的方向的标签使得属性图具有语义化特征。和节点一样,关系边也可以有属性,即边属性,可以通过在关系边上增加属性给图算法提供有关边的元信息,如创建时间等。此外还可以通过边属性为边增加权重和特性等其他额外语义,如下图所示。

请添加图片描述

相关资源

RDF

  • wiki: https://en.wikipedia.org/wiki/Resource_Description_Framework
  • 文档: https://www.w3.org/TR/rdf11-new/

RDF Schema

  • wiki: https://en.wikipedia.org/wiki/RDF_Schema
  • 文档: https://www.w3.org/TR/rdf11-schema/

R2RML: RDB to RDF Mapping Language

将数据库的数据映射到我们自己定义的本体上

  • 文档: https://www.w3.org/TR/r2rml/

D2RQ

将关系型数据库(如MySQL)转换为RDF

  • 官网: http://d2rq.org/
  • 知乎实践教程:
    • https://zhuanlan.zhihu.com/p/32552993
    • https://zhuanlan.zhihu.com/p/32880610

SPARQL

  • 简介: https://www.w3.org/TR/rdf-sparql-query/
  • 文档: https://www.w3.org/TR/sparql11-overview/
  • 知乎实践教程: https://zhuanlan.zhihu.com/p/32703794

Turtle (Terse RDF Triple Language)

  • 入门: https://linkeddata.github.io/rdflib.js/Documentation/turtle-intro.html
  • 文档: https://www.w3.org/TR/turtle/

OWL 2

  • 入门: https://www.w3.org/TR/owl2-primer/
  • 文档: https://www.w3.org/TR/owl2-overview/
  • 语法规范: https://www.w3.org/TR/2012/REC-owl2-syntax-20121211/

Protégé: ontology编辑器

  • https://protege.stanford.edu/
  • https://protege.stanford.edu/publications/ontology_development/ontology101.pdf

Apache Jena (知识推理)

  • 官网: https://jena.apache.org/
  • 知乎实践教程: https://zhuanlan.zhihu.com/p/33224431