分类 |
性能 |
可扩展性 |
灵活性 |
复杂性 |
键值存储数据库 |
高 |
高 |
高 |
无 |
文档数据库 |
高 |
可变 |
高 |
低 |
列存储数据库 |
高 |
可变 |
一般 |
低 |
图数据库 |
可变 |
高 |
高 |
高 |
关系型数据库 |
可变 |
可变 |
低 |
一般 |
表1:5类主流数据库产品分析
对于深度数据的分析和挖掘,以及面对新的实时计算应用的场景,图数据库技术显然是最好的解决方案!它完全区别于一般地、仅仅只解决数据存储整合和一些浅层计算任务的问题!
在处理高维和复杂的数据时,使用图数据库直观易用,可以更灵活地处理复杂和动态数据建模的可能性。
同时,由于底层硬件的发展以及学术界的整体研究重点集中在社交网络分析这一缺乏普遍性的图论分支等历史原因,工业级图数据库的研究停滞了几十年。在计算和存储设施快速发展以及大数据时代成熟的背景下,高性能图数据库无疑是推动各行业迭代发展的核心工具。
正如我们之前提到的,图具有其他类型的数据库和大数据框架所缺乏的自然可解释性。在处理复杂的关系数据时,传统数据库需要创建多个表,从而需要同时从多个表中检索数据。连接这些表的操作既复杂又耗时。此外,数据库写入需要考虑外键约束,这会导致显著的额外开销。相比之下,图模型灵活的索引结构允许更快的数据查询和分析,展示了图数据的高性能。
图数据是灵活的,具有高度适应性的数据模型,可以根据业务需求的变化进行调整。敏捷,图数据库的图形模型非常直观,支持测试驱动的开发方法,允许在每次构建过程中进行功能和性能测试,满足当今流行的敏捷开发实践的需求。
表2:主流图数据库对比
Nejo4j |
JanusGraph |
嬴图数据库 |
|
知名度 |
最高 |
高 |
一般 |
开源生态 |
社区版开源,但限制较多;商业版闭源: |
开源;兼容Apache Tinkerpop 生态,主要由AWS和IBM提供云服务 |
闭源主要由嬴图Cloud 提供云服务 |
图查询语言 |
Cypher |
Gremlin |
嬴图GQL |
支持数据规模 |
社区版十亿级;企业版千亿级以上 |
百亿级以上 |
千亿级以上 |
大规模数据写入性能 |
在线导入速度慢 |
较慢 |
在线导入速度快 |
大规模数据查询性能 |
快,较稳定 |
较快 |
快,超稳定 |
功能完善程度 |
完善 |
完善 |
完善 |
数据导入工具 |
支持CSV在线导入;支持格式丰富 |
未提供支持 |
嬴图 Transporter 支持全平台运行,支持格式丰富,提供文件例如TSV,CSV、Mysql,BigQuery 等数据导入能力以及 CSV 导出能力。 |
可视化界面 |
支持,功能丰富,支持可视化的数据建模、导入、分析等 |
不支持,需用户集成第三方界面 |
支持,功能丰富,支持2D、3D转换;支持可视化的数据建模、导入、分析等 |
内置常用图算法 |
提供安装算法包,提供了丰富的基本图算法 |
不支持 |
提供安装算法包,建有丰富的算法库,能以独立算法包的形式提供给用户。 |
基础功能(属性图的增删查改、持计划鵆、元数据、事务、缓存、查询优化、增量更新图等) |
支持 |
支持 |
支持 |
ACID事务 |
支持 |
部分支持,根据后端存储而定。 |
支持 |
chema约束 |
商业版支持,同时也支持Schema-Free |
支持,同时也支持Schema-Free |
支持,同时也支持Schema-Free |
图存储类型 |
支持本地存储,支持分布式存储,支持云托管存储 |
飞本地存储,支持分布式存储 |
|
图分区 |
支持 |
支持 |
支持 |
高可用HA |
商业版支持 |
未提供支持 |
支持 |