当前位置：首页 > news >正文

Ceph存储池参数中pg_num和pgp_num的关系

news 2025/8/13 9:35:41

在 Ceph 中，pg_num（Placement Group 数量）和 pgp_num（Placement Group for Placement 数量）是存储池的两个关键参数，虽然通常设置为相同值，但它们的职责完全不同。以下是详细对比和解释：

参数	作用范围	影响阶段	修改代价
`pg_num`	数据逻辑分片数量	数据写入阶段	高（触发数据迁移）
`pgp_num`	CRUSH 计算时的可用 PG 范围	数据分布阶段	低（仅影响新写入）

作用：决定存储池中逻辑分片（PG）的总数，直接影响：
- 数据分布的粒度（PG 越多，分布越均匀）。
- 每个 OSD 承载的 PG 数量（需满足 (pg_num × 副本数) / OSD总数 ≈ 100）。
修改影响：
- 增加 pg_num 会触发 数据重平衡（大规模数据迁移）。
- 减少 pg_num 通常不允许（可能导致数据丢失）。

作用：限定 CRUSH 算法在计算数据分布时可用的 PG 数量（必须 ≤ pg_num）。
- 仅影响新写入数据的分布位置。
- 不改变现有数据的 PG 映射（除非手动触发重平衡）。
修改影响：
- 增加 pgp_num 仅影响新数据，无数据迁移。
- 减少 pgp_num 可能导致新数据分布更集中（但旧数据不变）。

默认最佳实践：
当 pgp_num == pg_num 时，所有 PG 均可用于数据分布，确保：
- 最大化的数据分散性。
- 避免人为限制 CRUSH 算法的选择范围。
例外情况：
在特殊场景下（如临时优化性能），可能会设置 pgp_num < pg_num，但通常不推荐。

操作	`pg_num` 变化	`pgp_num` 变化
增加	触发数据迁移（分裂 PG）	仅影响新数据分布
减少	通常禁止	可能导致新数据分布收缩

# 创建池时通常设置 pg_num = pgp_num
ceph osd pool create mypool 128 128  # pg_num=128, pgp_num=128

# 扩容时同时增加 pg_num 和 pgp_num（避免数据分布受限）
ceph osd pool set mypool pg_num 256
ceph osd pool set mypool pgp_num 256  # 必须手动执行，不会自动同步

# 临时缩小 pgp_num 以减少数据分散（如调试性能问题）
ceph osd pool set mypool pgp_num 64  # 仅新数据使用前64个PG

检查当前设置：

ceph osd pool get mypool pg_num
ceph osd pool get mypool pgp_num

确保一致性：

# 如果 pgp_num < pg_num，建议调整为相同值
ceph osd pool set mypool pgp_num <pg_num_value>