当前位置: 首页 > news >正文

分布式ID 与自增区别

分布式ID与自增ID的深度对比

一、核心特性对比

特性自增ID分布式ID
生成方式数据库序列/表锁算法生成(雪花算法、UUID等)
连续性严格连续通常不连续(除特殊设计)
可预测性高度可预测不可预测(安全特性)
生成位置集中式存储生成分布式节点本地生成

二、架构影响分析

自增ID的架构限制

图表

代码

  • 瓶颈:所有应用实例竞争同一数据源获取ID

  • 扩展问题:水平扩展时需考虑分库分表后的ID冲突

分布式ID的架构优势

图表

代码

  • 无竞争:各节点独立生成ID

  • 无限扩展:理论上只要算法允许可无限扩展节点

三、性能指标对比

指标自增ID分布式ID
QPS上限约5万(MySQL)100万+
网络延迟影响严重依赖无依赖
数据库负载
生成耗时(平均)1-5ms0.01-0.1ms

四、典型实现方案

自增ID实现

sql

-- MySQL实现
CREATE TABLE users (id BIGINT AUTO_INCREMENT PRIMARY KEY
);-- PostgreSQL序列
CREATE SEQUENCE user_id_seq;
CREATE TABLE users (id BIGINT DEFAULT nextval('user_id_seq') PRIMARY KEY
);

分布式ID实现

雪花算法(Snowflake)示例

java

public class SnowflakeIdGenerator {private final long datacenterId;private final long machineId;private long sequence = 0L;private long lastTimestamp = -1L;public synchronized long nextId() {long timestamp = System.currentTimeMillis();if (timestamp < lastTimestamp) {throw new RuntimeException("时钟回拨异常");}if (timestamp == lastTimestamp) {sequence = (sequence + 1) & 0xFFF;if (sequence == 0) {timestamp = tilNextMillis(lastTimestamp);}} else {sequence = 0L;}lastTimestamp = timestamp;return ((timestamp - 1288834974657L) << 22) | (datacenterId << 17) | (machineId << 12) | sequence;}
}

五、业务场景选择指南

适合自增ID的场景

  1. 单体架构应用

  2. 需要严格递增的审计场景

  3. 简单查询优化需求(如 WHERE id > 1000)

  4. 与ORM框架深度集成的项目

适合分布式ID的场景

  1. 微服务架构系统

  2. 高并发写入需求(如电商下单)

  3. 需要隐藏业务量的场景(安全考虑)

  4. 多数据中心部署

六、特殊问题处理

自增ID的分库分表问题

sql

-- 采用分段分配策略
-- 实例1分配1-100万
-- 实例2分配100万-200万
ALTER TABLE users AUTO_INCREMENT=1000000;

分布式ID的时钟回拨解决方案

  1. 短暂回拨:等待时钟同步

  2. 严重回拨

    java

    // 备用生成器方案
    if (clockDrift > THRESHOLD) {return backupGenerator.nextId();
    }
  3. 无时钟依赖方案

    java

    // 使用递增计数器+机器ID
    atomicCounter.incrementAndGet() | (machineId << 48)

七、混合方案实践

ID组合模式

text

[类型前缀(2位)][时间戳(32位)][自增序列(20位)][机器ID(10位)]

示例实现:

python

def generate_id():type_prefix = 0x01  # 业务类型编码timestamp = int(time.time() * 1000)sequence = redis.incr('id_sequence') & 0xFFFFFmachine_id = 0x3FF & get_machine_ip_hash()return (type_prefix << 62) | (timestamp << 20) | sequence | machine_id

根据业务需求合理选择ID生成策略,在分布式环境下通常优先考虑分布式ID方案,但在特定场景下自增ID仍具有不可替代的优势。

http://www.lryc.cn/news/584047.html

相关文章:

  • 【spring boot】三种日志系统对比:ELK、Loki+Grafana、Docker API
  • 膨胀卷积介绍
  • XGBoosting算法详解(Boosting思想的代表算法)
  • 字节 Seed 团队联合清华大学智能产业研究院开源 MemAgent: 基于多轮对话强化学习记忆代理的长文本大语言模型重构
  • 深度学习中的常见损失函数详解及PyTorch实现
  • PyTorch Tensor 操作入门:转换、运算、维度变换
  • pytorch 神经网络
  • PyTorch自动微分:从基础到实战
  • 【Pandas】pandas DataFrame from_records
  • 【PyTorch】PyTorch中的数据预处理操作
  • 杰赛S65_中星微ZX296716免拆刷机教程解决网络错误和时钟问题
  • RocketMQ安装(Windows环境)
  • 零成本实现商品图换背景
  • 特征筛选步骤
  • 计算机视觉 之 数字图像处理基础
  • NAT技术(网络地址转换)
  • IPv4和IPv6双栈配置
  • CRT 不同会导致 fopen 地址不同
  • 飞书AI技术体系
  • Java 正则表达式白皮书:语法详解、工程实践与常用表达式库
  • OSPF协议:核心概念与配置要点解析
  • 栈题解——有效的括号【LeetCode】两种方法
  • ACL协议:核心概念与配置要点解析
  • LlamaFactory Demo
  • 强缓存和协商缓存详解
  • SQL进阶:自连接的用法
  • 深度探索:实时交互与增强现实翻译技术(第六篇)
  • 【郑大二年级信安小学期】Day9:XSS跨站攻击XSS绕过CSRF漏洞SSRF漏洞
  • 医院多部门协同构建知识库-指南库-预测模型三维网络路径研究
  • 【C++】第十四节—模版进阶(非类型模版参数+模板的特化+模版分离编译+模版总结)