GreptimeDB v0.12 发布,开源 Rust 时序数据库

发布于:2025-03-04 ⋅ 阅读:(14) ⋅ 点赞:(0)

GreptimeDB 是由格睿科技开发的开源时序数据库,基于 Rust 语言构建,以云原生、高性能、低成本为核心优势。根据现有信息,其最新版本 v0.12 的具体特性尚未在提供的摘要中明确提及,但结合 GreptimeDB 的发展历程和技术路线,可以推测其可能延续以下核心优势:

  1. 云原生架构
    支持分布式部署,分离计算与存储,利用云对象存储(如 S3)实现低成本存储,存储成本降低 50 倍,同时具备无限水平扩展能力。

  2. 高性能与存储优化
    采用自研存储引擎 Mito,支持列式存储与自适应压缩(30 倍无损压缩),提升查询性能与资源利用率。分布式并行查询引擎优化高基数场景,支持实时分析。

  3. 多协议兼容
    支持 SQL、PromQL、InfluxDB 行协议、OpenTelemetry 等,无缝对接现有监控与分析工具,降低迁移成本。

  4. 边缘计算与车云协同
    轻量级二进制文件可部署于车端或边缘设备,结合云端企业版实现边云数据协同,降低车端流量成本至 1/10。

  5. 生态扩展
    近期版本(如 v0.10)引入向量搜索功能,与蚂蚁集团 VSAG 索引库合作,检索性能提升 5 倍,支持图片嵌入等 AI 场景。

  6. 未来演进方向
    根据 Roadmap,GreptimeDB 计划在 2024 年推出智能索引、流计算组件 Greptime Flow、日志引擎等,进一步强化时序数据处理能力。

GreptimeDB 在其发展过程中引入了向量搜索功能

功能特点

  1. 与先进索引库合作:GreptimeDB 与蚂蚁集团的 VSAG 索引库进行合作。VSAG 索引库是一种高效的向量索引结构,通过这种合作,GreptimeDB 在向量搜索方面的检索性能得到了显著提升,据相关信息表明检索性能提升了 5 倍。这意味着在处理大规模向量数据时,GreptimeDB 能够更快地找到与查询向量最相似的向量数据,大大提高了搜索效率。
  2. 支持多种 AI 场景:能够支持如图片嵌入等 AI 场景。以图片为例,GreptimeDB 可以将图片转换为向量表示并存储在数据库中,当需要查找相似图片时,通过向量搜索功能可以快速定位到相关图片。这对于图像识别、图像搜索等应用场景非常有帮助,使得 GreptimeDB 可以在 AI 领域的应用中发挥重要作用。
  3. 融入整体数据库架构:向量搜索功能是集成在 GreptimeDB 整体的数据库架构中的,与数据库的其他功能(如时序数据处理、SQL 查询等)能够很好地协同工作。用户可以在同一个数据库系统中同时处理时序数据和进行向量搜索,无需额外搭建复杂的多系统架构,降低了系统的复杂度和管理成本。

应用场景

  • 图像搜索:在图像数据库中,用户可以上传一张图片,通过 GreptimeDB 的向量搜索功能找到与之相似的其他图片,可应用于电商平台的商品图片搜索、图片素材库的搜索等场景。
  • 文本推荐:将文本转换为向量后,根据用户输入的文本向量,搜索与之相似的文本内容,为用户推荐相关的文章、新闻等,适用于新闻资讯平台、知识管理系统等。
  • AI 模型训练数据筛选:在 AI 模型训练过程中,需要从大量的数据中筛选出与训练目标相似的数据。GreptimeDB 的向量搜索功能可以帮助快速定位这些数据,提高模型训练的效率和质量。

网站公告

今日签到

点亮在社区的每一天
去签到