缓存雪崩、缓存穿透、缓存预热、缓存更新、缓存降级
1. 缓存雪崩(Cache Avalanche)
定义:缓存雪崩是指大量缓存中的数据在同一时间过期,导致大量请求同时访问数据库,造成数据库压力骤增,甚至可能导致数据库崩溃。
原因:
-
多个缓存的 key 在同一时间过期;
-
当这些 key 不再命中缓存时,所有请求都会同时访问数据库。
应对策略:
-
设置过期时间加随机值:避免缓存的 key 在相同时间过期。比如,如果某个 key 设置过期时间为 1 小时,可以随机设置在 59 分钟到 61 分钟之间。
EXPIRE key 3600
-
分批过期:不同的数据设置不同的过期时间,避免同一时刻大量缓存失效。
-
提前加载缓存(缓存预热):在应用启动时预加载热点数据到缓存中,减少初次使用时数据库的压力。
2. 缓存穿透(Cache Penetration)
定义:缓存穿透是指查询一个缓存中和数据库中都不存在的数据(例如恶意请求或查询条件错误),导致每次请求都访问数据库,缓存无法发挥作用。
原因:
-
用户查询的键既不在缓存中,也不在数据库中;
-
可能是由于客户端错误、恶意攻击或非法请求。
应对策略:
-
布隆过滤器(Bloom Filter):布隆过滤器能够高效地判断某个数据是否存在于数据库中。通过在缓存之前进行一次判断,如果数据不存在,直接返回,不访问数据库。布隆过滤器的误判率很低,但能有效避免不必要的数据库访问。
示例:检查某个ID是否存在于数据库中,如果不存在,则直接返回“数据不存在”。
if (!bloomFilter.contains(id)) {return null; // 数据不存在,直接返回 }
-
缓存空值:对于不存在的数据,可以在缓存中设置一个特殊的标记(如空字符串或特定对象),表示此数据为空,这样后续相同请求会直接返回缓存,不再查询数据库。
3. 缓存预热(Cache Warming)
定义:缓存预热是指在系统启动或缓存空置时,提前将热点数据加载到缓存中,以避免缓存未命中的“冷启动”问题。
原因:
-
系统启动或缓存清空后,第一次查询可能会直接查询数据库,影响性能;
-
高频查询数据可以提前加载到缓存中,避免访问数据库。
应对策略:
-
手动预热:在系统启动时,通过脚本或程序将热点数据加载到缓存中。
public void preLoadCache() {List<String> hotData = database.queryHotData();for (String data : hotData) {redis.set(data);} }
-
自动预热:通过定时任务或后台进程,定期更新缓存内容。
-
基于访问频率预热:通过日志、监控分析,发现访问频率较高的数据,优先加载到缓存。
4. 缓存更新(Cache Update)
定义:缓存更新是指在缓存中的数据发生变化时,如何保证缓存中的数据与数据库中的数据一致。
问题:
-
数据库数据更新后,缓存中的数据可能变得过时;
-
需要确保数据一致性。
应对策略:
-
缓存失效(Cache Invalidation):数据更新后,主动删除缓存中的对应数据,确保下次访问时重新从数据库加载并更新缓存。
// 数据更新后清除缓存 redis.del(key);
-
缓存更新(Cache Update):在数据库更新后,直接更新缓存中的数据,确保缓存和数据库中的数据一致。
// 更新数据库后同步更新缓存 redis.set(key, updatedValue);
-
双写策略(Double Write):更新数据库的同时,直接更新缓存。这需要确保缓存更新的原子性,否则可能出现缓存与数据库不一致的情况。
5. 缓存降级(Cache Degradation)
定义:缓存降级是指在缓存服务不可用或缓存故障时,采取的一种策略来降低对数据库的压力,并确保系统可以继续提供服务。
原因:
-
缓存服务宕机或超时;
-
缓存中数据不存在或无法访问。
应对策略:
-
服务降级:当缓存失效时,可以降级到直接从数据库中获取数据。为了避免大量数据库访问,可以在数据库查询时做限流或熔断处理。
-
降级返回默认值:当缓存不可用时,返回默认值或者保留上次的缓存值,而不是直接请求数据库。
-
缓存预热与补偿机制:在缓存失败时,通过后台异步任务去更新缓存,减少对数据库的直接访问。
6. 总结
问题 | 描述 | 应对策略 |
---|---|---|
缓存雪崩 | 多个缓存数据同时过期,导致大量请求直接访问数据库,可能崩溃 | 设置过期时间加随机值、分批过期、提前加载热点数据(缓存预热) |
缓存穿透 | 查询数据既不在缓存中,也不在数据库中,造成数据库压力 | 布隆过滤器、缓存空值 |
缓存预热 | 系统启动时,提前加载热点数据到缓存中,避免冷启动 | 手动预热、自动预热、基于访问频率预热 |
缓存更新 | 数据更新后,保证缓存和数据库一致性 | 缓存失效、缓存更新、双写策略 |
缓存降级 | 缓存不可用时,降级到数据库查询或返回默认值,保证系统可用性 | 服务降级、返回默认值、后台异步任务更新缓存 |