Python的模块缓存机制是import体系的核心组成部分,所有导入的模块都会被缓存到sys.modules字典中,后续再次导入相同模块时直接从缓存返回,避免重复执行模块代码。importlib作为Python官方推荐的导入实现库,完整承载了缓存的处理逻辑。

模块缓存的存储载体
模块缓存的核心存储位置是sys.modules,这是一个全局字典,键为模块的完整名称字符串,值为已经加载的模块对象。我们可以在Python交互式环境中直接查看这个字典的内容:
import sys # 查看当前已缓存的模块 print(type(sys.modules)) print(list(sys.modules.keys())[:5]) # 打印前5个缓存的模块名
在importlib的源码中,sys.modules的引用被封装在importlib._bootstrap模块的_get_module_lock等函数中,所有缓存操作都围绕这个字典展开。
缓存的查询逻辑
当执行import语句时,importlib会首先查询sys.modules中是否已经存在目标模块,对应的核心逻辑在importlib._bootstrap._find_and_load函数中,简化后的流程如下:
def _find_and_load(name, import_):
# 第一步:检查缓存中是否已有该模块
if name in sys.modules:
return sys.modules[name]
# 后续是查找模块、加载模块的逻辑
# ...
# 加载完成后写入缓存
sys.modules[name] = module
return module
如果缓存中存在对应模块,直接返回模块对象,不会触发后续的模块查找和加载流程,这也是Python中重复导入同一个模块不会重复执行模块顶层代码的原因。
缓存的写入时机
模块缓存的写入发生在模块加载完成之后,在importlib._bootstrap._load_module函数中,当模块的代码执行完毕、模块对象创建完成后,会将模块对象写入sys.modules:
def _load_module(name, module, loader):
# 执行模块的加载逻辑,运行模块代码
loader.exec_module(module)
# 将加载完成的模块写入缓存
sys.modules[name] = module
return module
需要注意的是,缓存的写入发生在模块代码执行之后,因此在模块代码执行过程中,如果模块内部有循环导入的逻辑,可能会出现缓存中还没有当前模块的情况,这也是循环导入容易引发异常的原因之一。
缓存的失效与清除
默认情况下,sys.modules中的缓存会一直存在,直到Python进程结束。如果需要清除缓存重新加载模块,可以直接操作sys.modules字典:
import sys
import importlib
# 假设已经导入过demo模块
if "demo" in sys.modules:
# 从缓存中删除demo模块
del sys.modules["demo"]
# 重新导入,会触发完整的加载流程
import demo
不过手动清除缓存需要注意依赖问题,如果其他模块已经引用了被删除的模块对象,可能会出现引用不一致的情况,实际开发中更推荐使用importlib.reload函数来重载模块,该函数会处理缓存的更新逻辑。
特殊场景下的缓存处理
对于包模块的导入,importlib会将包本身和包内的子模块分别缓存到sys.modules中,例如导入demo.sub时,sys.modules中会同时存在demo和demo.sub两个键。另外,对于被标记为None的缓存项,importlib会认为该模块导入失败,后续导入会直接抛出异常,不会再次尝试加载。
通过梳理importlib的源码逻辑可以看出,Python的模块缓存机制设计非常简洁高效,通过全局字典的查询和写入操作,实现了模块的一次加载多次复用,是Python运行时性能优化的重要体现。
Pythonimportlib模块缓存sys_modules修改时间:2026-06-15 15:12:21