当前位置：首页 > news >正文

【Java面试】讲讲Redis的Cluster的分片机制

news 2025/7/3 5:55:48

Redis Cluster 采用 虚拟哈希槽分区，将数据分散到 16384 个固定槽位（slot）上，每个主节点负责一部分槽位。键的槽位计算方式为：

slot = CRC16(key) % 16384  # 仅计算键中`{}`内的内容（如`user:{1000}`仅哈希`1000`）

分片流程示例：

为何选择 16384 槽？

内存与性能平衡：集群心跳包需同步槽位映射信息，16384 槽仅占用 2KB 内存（每个槽用 2 字节存储），若用 65536 槽则需 8KB，影响 Gossip 协议效率。
避免热点问题：哈希槽均匀分布数据，相比范围分片或一致性哈希，能更好避免数据倾斜。

解耦数据与节点：
- 槽位与节点动态绑定，扩容时只需迁移部分槽位，无需全量数据重分布。
客户端透明路由：
- 客户端连接任意节点，若键不属于该节点，返回 MOVED <slot> <目标节点> 重定向指令，智能客户端（如 Lettuce）会缓存槽位映射表减少重定向。
动态扩缩容：
- 新增节点时，通过 redis-cli --cluster reshard 迁移槽位数据，支持在线操作不影响服务。

挑战	解决方案
跨槽操作限制	- 使用 Hash Tag 强制相关键落入同一槽（如 `user:{1000}.name` 和 `user:{1000}.age`）。
数据迁移复杂度	- 采用增量迁移：`MIGRATE` 命令批量迁移键，避免阻塞集群。 - 监控迁移进度：`CLUSTER SLOTS` 检查槽位分布均匀性。
故障转移延迟	- 调整 `cluster-node-timeout`（建议 15-30 秒），平衡故障检测速度与网络容错。
脑裂风险	- 配置 `min-replicas-to-write` 确保主节点写入至少 N 个从节点，避免网络分区时数据丢失。
客户端兼容性	- 使用支持集群协议的客户端（如 Jedis Cluster），避免手动处理 `MOVED/ASK` 重定向。

预分片（Pre-sharding）：初期按业务预估分配槽位，避免频繁迁移。
监控与告警：
- 关键指标：槽位覆盖率（cluster_slots_ok）、节点状态（CLUSTER NODES）、内存使用率（INFO MEMORY）。
避免大 Key：单 Key 数据过大导致迁移阻塞，需拆分或优化数据结构。