在Python开发中,使用内置的dict结构可以快速实现基础的键值对缓存,但是默认的dict不会自动清理过期数据,数据会一直占用内存。通过给每个缓存项添加过期时间戳,结合简单的逻辑判断和清理机制,就能实现带TTL的dict缓存,满足临时数据的存储需求。

核心设计思路
带TTL的dict缓存需要额外存储每个键的过期时间,因此不能直接使用原生dict存储值,而是需要将值和时间戳组合成一个结构。整体设计包含三个核心部分:
- 存储结构:使用dict作为外层容器,键为用户传入的缓存键,值为包含缓存数据和过期时间戳的元组
- 写入逻辑:写入缓存时,根据用户传入的TTL计算过期时间,和缓存值一起存入容器
- 读取逻辑:读取缓存时,先判断当前时间是否超过过期时间,如果超过则返回None并清理该键,否则返回缓存值
基础实现代码
以下是一个简单的带TTL的dict缓存实现,支持设置缓存、获取缓存、手动清理过期数据的功能:
import time
class TTLDictCache:
def __init__(self):
# 存储结构:{key: (value, expire_timestamp)}
self._cache = {}
def set(self, key, value, ttl):
"""
设置缓存
:param key: 缓存键
:param value: 缓存值
:param ttl: 过期时间,单位秒
"""
expire_time = time.time() + ttl
self._cache[key] = (value, expire_time)
def get(self, key):
"""
获取缓存
:param key: 缓存键
:return: 缓存值,不存在或已过期返回None
"""
if key not in self._cache:
return None
value, expire_time = self._cache[key]
# 判断是否已经过期
if time.time() > expire_time:
# 过期则删除键
del self._cache[key]
return None
return value
def clear_expired(self):
"""手动清理所有过期的缓存"""
current_time = time.time()
# 遍历所有键,过滤出过期的键
expired_keys = [key for key, (_, expire_time) in self._cache.items() if current_time > expire_time]
for key in expired_keys:
del self._cache[key]
def size(self):
"""返回当前缓存的键数量"""
return len(self._cache)
代码功能说明
上面的TTLDictCache类实现了基础的TTL缓存功能,各个方法的逻辑如下:
set方法
接收缓存键、缓存值、TTL三个参数,通过time.time()获取当前时间戳,加上TTL得到过期时间戳,将值和过期时间戳组成元组存入内部的_cache字典中。
get方法
首先判断键是否存在,不存在直接返回None。如果存在则取出值和过期时间戳,对比当前时间和过期时间戳,如果当前时间更大说明已经过期,删除该键并返回None,否则返回缓存值。
clear_expired方法
遍历所有缓存键,筛选出所有过期的键,然后批量删除,用于主动清理过期数据,避免过期数据长期占用内存。
size方法
返回当前缓存中键的数量,方便查看缓存的使用情况。
使用示例
以下是该缓存类的实际使用例子:
# 初始化缓存实例
cache = TTLDictCache()
# 设置缓存,TTL为5秒
cache.set("user_1", {"name": "张三", "age": 20}, 5)
cache.set("user_2", {"name": "李四", "age": 22}, 10)
# 立即获取缓存,正常返回数据
print(cache.get("user_1")) # 输出:{'name': '张三', 'age': 20}
print(cache.size()) # 输出:2
# 等待6秒后再次获取user_1的缓存,已经过期返回None
time.sleep(6)
print(cache.get("user_1")) # 输出:None
print(cache.size()) # 输出:1
# 手动清理过期数据后,缓存大小不变(因为get时已经删除了过期键)
cache.clear_expired()
print(cache.size()) # 输出:1
优化方向
上面的实现是基础版本,在实际使用中可以根据需求做进一步优化:
- 添加最大缓存数量限制,当缓存数量超过阈值时,按照过期时间优先清理即将过期的键,或者按照LRU策略清理
- 将手动清理过期数据的逻辑改为后台线程定期自动清理,避免过期数据堆积
- 添加线程安全机制,在多线程环境下使用锁保证缓存操作的原子性,避免并发问题
- 支持自定义时间戳来源,方便在测试场景中使用固定的时间,而不是真实的系统时间
注意:这种基于dict实现的TTL缓存适合单进程、小规模的临时缓存场景,如果需要跨进程、高性能或者支持分布式场景,建议使用Redis等专业缓存工具,本文的实现更适合轻量级的本地缓存需求。