postgresql中的vm指的是可见性映射(Visibility Map),是和每个数据表对应的附属文件,主要用于记录表中数据页的可见性状态,减少不必要的元组扫描,提升数据库操作效率。

postgresql vm的基本概念
每个postgresql的数据表在磁盘上除了存储主数据文件(后缀为<tt>),还会对应一个可见性映射文件,后缀为<vm>。vm文件以数据页为单位,记录每个数据页中所有元组是否对所有事务都可见,避免扫描时重复检查事务可见性。
vm中的可见性标记分为两个级别:
- 全可见标记:页中所有元组对所有活跃事务都可见,扫描时可以直接跳过可见性判断
- 全冻结标记:页中所有元组已经被冻结,不需要参与事务ID回卷检查,是比全可见更稳定的状态
postgresql vm的映射规则
vm文件的存储结构和主数据文件类似,也是按页组织,每个vm页对应主数据文件的一组数据页。每个数据页在vm中占2个比特位,分别对应全可见和全冻结两个状态:
| 比特位位置 | 状态含义 | 取值说明 |
|---|---|---|
| 第0位 | 全可见标记 | 1表示页中所有元组对所有事务可见,0表示存在不可见元组 |
| 第1位 | 全冻结标记 | 1表示页中所有元组已被冻结,0表示未冻结 |
假设主数据文件的第N个数据页,对应的vm标记位置为vm文件的第 (N * 2 / 8) 个字节的第 (N * 2 % 8) 和 (N * 2 % 8 + 1) 个比特位。例如第0个数据页对应vm文件的第0字节的第0、1位,第1个数据页对应第0字节的第2、3位,以此类推。
postgresql vm的可见性管理逻辑
可见性标记的更新时机
vm的标记不是实时更新的,主要由vacuum操作触发更新:
- 当vacuum扫描数据页时,如果发现页中所有元组对所有事务都可见,就会将对应vm页的全可见位设为1
- 如果vacuum过程中对元组做了冻结操作,且页中所有元组都被冻结,就会将全冻结位设为1
- 当数据页发生修改(比如插入、更新、删除元组)时,对应的vm全可见位会被重置为0,因为修改后页中可能存在不可见的旧版本元组
可见性标记的使用场景
vm的可见性标记主要在以下场景中发挥作用:
- 索引仅扫描(Index Only Scan):如果查询只需要返回索引列,且对应的vm标记显示数据页全可见,就可以直接从索引返回结果,不需要回表检查元组可见性,大幅提升扫描效率
- vacuum操作优化:vacuum扫描时可以跳过全可见标记的数据页,减少IO开销,只有标记为非全可见的页才需要详细扫描
- 事务可见性判断:在执行查询时,对于全可见的数据页,可以直接返回其中的元组,不需要逐个检查元组的xmin、xmax等事务信息
vm相关操作示例
我们可以通过postgresql的系统函数查看vm的状态,以下是一个查询表对应vm文件信息的示例:
-- 查询表的relfilenode,对应磁盘文件的名称 SELECT relname, relfilenode FROM pg_class WHERE relname = 'test_table'; -- 查看表的vm文件是否存在,以及大小信息(需要在数据库数据目录下执行) -- 假设relfilenode为12345,vm文件路径为 base/数据库oid/12345_vm
如果需要强制更新vm标记,可以手动执行vacuum操作:
-- 对test_table执行vacuum,更新对应的vm标记 VACUUM test_table; -- 如果需要冻结元组,可以执行带FREEZE选项的vacuum VACUUM FREEZE test_table;
vm的常见问题与优化
如果vm文件损坏,可能会导致索引仅扫描无法正常工作,或者vacuum操作效率下降。此时可以通过重新执行vacuum操作重建vm标记,postgresql在vacuum过程中会重新计算并更新vm的状态。
另外,频繁更新的表可能会导致vm的全可见标记频繁被重置,此时可以适当调整vacuum的触发频率,保证vm的标记及时更新,维持查询效率。对于只读或者很少更新的表,vm的全可见标记会长期保持,能最大程度发挥vm的优化作用。
postgresqlvm可见性管理vm映射修改时间:2026-06-12 11:42:15