1. 核心需求
全局唯一:确保分布式环境下生成的ID无冲突。
高可用:服务无单点故障,99.99%+可用性。
低延迟:ID生成响应时间控制在毫秒级。
趋势递增:对数据库索引友好(如InnoDB的B+树索引)。
可扩展:支持水平扩展,适应业务增长。
容灾能力:应对时钟回拨、节点宕机等异常场景。
2. 常见方案对比
方案 | 优点 | 缺点 | 适用场景 |
---|---|---|---|
UUID | 简单、本地生成、无中心化依赖 | 无序、存储空间大、索引效率低 | 临时标识、非数据库主键 |
数据库自增ID | 递增、易实现 | 性能瓶颈、分库分表困难、单点风险 | 小规模单体应用 |
Redis原子操作 | 高性能、可生成有序ID | 依赖持久化、集群扩展复杂 | 中等并发、允许短暂数据丢失 |
Snowflake算法 | 高性能、趋势递增、去中心化 | 时钟回拨问题、机器ID分配需管理 | 高并发分布式系统 |
号段模式 | 批量获取、降低数据库压力 | 需预分配号段、故障时可能浪费号段 | 分库分表、中高并发 |
Leaf/美团方案 | 结合号段与Snowflake,解决时钟问题 | 架构较复杂、依赖外部存储 | 高并发且要求严格递增 |
3. 基于Snowflake的改进方案设计
Snowflake原始结构
64位ID结构:
0 | 时间戳(41位) | 机器ID(10位) | 序列号(12位)
时间戳:毫秒级,可使用约69年。
机器ID:支持1024个节点。
序列号:每毫秒可生成4096个ID。
改进点
1.解决时钟回拨:
方案1:关闭时钟同步,依赖本地时钟(风险高)。
方案2:时钟回拨时等待或抛出异常,并记录告警。
方案3:扩展时间戳为“时间戳+逻辑时钟”,如百度的UidGenerator。
2.动态机器ID分配:
ZooKeeper/etcd:节点启动时申请唯一ID并持久化。
Redis自增:通过
INCR
命令分配机器ID。IP+Port哈希:根据服务实例的网络标识生成唯一ID。
3.扩展性优化:
调整位数分配(如增加机器ID位数以适应更多节点)。
自定义纪元(Epoch),延长可用年限。
4. 号段模式(Segment)设计
核心思想
预先从数据库批量获取ID号段,缓存在本地内存,减少数据库访问压力。
实现步骤
数据库表设计:
CREATE TABLE id_generator ( biz_tag VARCHAR(128) PRIMARY KEY, -- 业务标识 max_id BIGINT NOT NULL, -- 当前最大ID step INT NOT NULL, -- 号段长度 version BIGINT NOT NULL -- 乐观锁版本号 );
2.号段获取流程:
服务启动时从数据库加载初始号段(如
max_id=1000, step=1000
)。当本地号段使用至80%时,异步请求下一个号段。
使用乐观锁更新数据库:
UPDATE id_generator SET max_id = max_id + step, version = version + 1 WHERE biz_tag = 'order' AND version = #{old_version};
3.容灾与高可用:
多实例部署时,各实例独立缓存号段,避免竞争。
数据库宕机时,依赖本地缓存继续分配ID,直至号段耗尽。
5. 混合方案:Leaf-Segment + Snowflake
设计架构:
Leaf-Segment:处理趋势递增需求(如订单ID)。
Leaf-Snowflake:解决时钟回拨问题,提供高性能生成。
实现步骤:
1.Leaf-Segment:
通过号段模式预分配ID区间。
结合数据库与本地缓存,支持动态扩容。
2.Leaf-Snowflake:
使用ZooKeeper协调机器ID分配。
监控时钟回拨,触发告警并暂停服务。
6. 高可用与容灾设计
1.多级缓存:
本地内存缓存号段 + Redis缓存备份,防止数据库瞬时故障。
2.降级策略:
数据库不可用时,切换至Snowflake模式生成ID(牺牲趋势递增性)。
3.时钟同步:
部署NTP服务,并监控时钟偏差,偏差超过阈值时告警。
4.监控与告警:
监控ID生成速率、号段剩余量、时钟状态等关键指标。
7. 典型面试题
1.Snowflake算法如何解决时钟回拨?
记录上次生成ID的时间戳,检测到回拨时等待或抛出异常。
2.号段模式如何避免号段浪费?
动态调整
step
值,根据业务吞吐量分配合理号段长度。
3.如何实现跨机房ID生成?
将机器ID高位表示机房编号,低位表示节点编号(如:2位机房 + 8位节点)。
4.ID递增是否会导致数据泄露?
可引入哈希算法或对ID进行加密,避免暴露业务增长趋势。
8. 总结
选型关键:根据业务场景(是否需严格递增、并发量、容灾要求)选择方案。
最佳实践:
中小规模:号段模式 + 数据库。
高并发:改进版Snowflake(Leaf-Snowflake)。
混合需求:Leaf-Segment与Snowflake结合。
设计原则:简单性、可扩展性、故障隔离。