neo4j中导入csv格式的三元组数据

发布于:2025-03-31 ⋅ 阅读:(25) ⋅ 点赞:(0)

csv数据格式:

head_entity,relation,tail_entity
02.02类以外的脂肪乳化制品,包括混合的和(或)调味的脂肪乳化制品,允许添加,β-胡萝卜素
02.02类以外的脂肪乳化制品,包括混合的和(或)调味的脂肪乳化制品,允许添加,丁基羟基茴香醚
02.02类以外的脂肪乳化制品,包括混合的和(或)调味的脂肪乳化制品,允许添加,丙二醇脂肪酸酯
02.02类以外的脂肪乳化制品,包括混合的和(或)调味的脂肪乳化制品,允许添加,二丁基羟基甲苯
02.02类以外的脂肪乳化制品,包括混合的和(或)调味的脂肪乳化制品,允许添加,双乙酰酒石酸单双甘油酯
02.02类以外的脂肪乳化制品,包括混合的和(或)调味的脂肪乳化制品,允许添加,司盘类[包括山梨醇酐单月桂酸酯

python代码

from neo4j import GraphDatabase
import pandas as pd

# 1. 读取三元组数据
csv_path = "aaa.csv" # cvs文件路径
df = pd.read_csv(csv_path)

# 2. 连接 Neo4j
uri = "bolt://localhost:7687"  # 本地部署
username = "neo4j"
password = "****"  # ⚠️ 替换为你自己的neo4j密码

driver = GraphDatabase.driver(uri, auth=(username, password))

# 3. 执行 Cypher 创建节点和关系
def create_graph(tx, head, relation, tail):
    query = (
        "MERGE (h:Entity {name: $head}) "
        "MERGE (t:Entity {name: $tail}) "
        "MERGE (h)-[r:`" + relation + "`]->(t)"
    )
    tx.run(query, head=head, tail=tail)

with driver.session() as session:
    for idx, row in df.iterrows():
        head = str(row["head_entity"])
        relation = str(row["relation"])
        tail = str(row["tail_entity"])
        session.write_transaction(create_graph, head, relation, tail)

driver.close()
print("数据导入完成 ✅")