在业务系统中,树状结构数据的存储和查询是非常常见的需求,比如企业的部门层级、电商的商品类目、内容的评论嵌套等场景都需要处理这类数据。传统的邻接表方案虽然存储简单,但在进行层级查询时存在性能瓶颈,而闭包表可以有效解决这个问题。

什么是闭包表
闭包表的核心思路是除了存储树状节点本身的信息外,额外创建一张关系表,存储树中每一个节点到它的所有祖先节点的路径关系,包括节点到自身的路径。这样在查询层级关系时,不需要递归遍历,直接通过关系表做关联查询即可。
假设我们有一个部门表,存储部门的基本信息,比如部门ID、部门名称,这就是节点表。再创建一个部门关系表,存储两个部门ID,一个是祖先节点ID,一个是后代节点ID,同时可以存储两个节点之间的层级距离,这就是闭包表的核心关系表。
闭包表的设计与初始化
1. 创建节点表
首先创建存储部门节点的表,结构如下:
-- 部门节点表,存储部门基本信息
CREATE TABLE department (
id INT PRIMARY KEY AUTO_INCREMENT,
name VARCHAR(50) NOT NULL COMMENT '部门名称'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
2. 创建闭包关系表
闭包关系表需要存储祖先节点ID、后代节点ID,以及两者之间的层级距离,结构如下:
-- 部门闭包关系表,存储所有节点的路径关系
CREATE TABLE department_closure (
ancestor_id INT NOT NULL COMMENT '祖先节点ID',
descendant_id INT NOT NULL COMMENT '后代节点ID',
depth INT NOT NULL COMMENT '祖先到后代的层级距离,0表示自身',
PRIMARY KEY (ancestor_id, descendant_id),
FOREIGN KEY (ancestor_id) REFERENCES department(id) ON DELETE CASCADE,
FOREIGN KEY (descendant_id) REFERENCES department(id) ON DELETE CASCADE
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
3. 插入初始数据
假设我们插入一个根节点“总公司”,对应的闭包关系需要插入自身到自身的路径:
-- 插入根节点
INSERT INTO department (name) VALUES ('总公司');
-- 插入根节点的闭包关系,自身到自身距离为0
INSERT INTO department_closure (ancestor_id, descendant_id, depth) VALUES (1, 1, 0);
如果现在要插入一个子节点“技术部”,父节点是“总公司”,那么需要插入的关系包括:总公司到技术部(距离1)、技术部到自身(距离0):
-- 插入子节点技术部
INSERT INTO department (name) VALUES ('技术部');
-- 插入技术部的闭包关系,先插入自身关系
INSERT INTO department_closure (ancestor_id, descendant_id, depth) VALUES (2, 2, 0);
-- 插入父节点到新节点的关系,查询父节点的所有祖先,加上新节点作为后代,距离+1
INSERT INTO department_closure (ancestor_id, descendant_id, depth)
SELECT ancestor_id, 2, depth + 1 FROM department_closure WHERE descendant_id = 1;
基于闭包表的常用层级查询
查询某个节点的所有子节点
要查询“总公司”的所有子节点,只需要查询闭包表中ancestor_id为总公司ID,且depth大于0的记录,关联部门表获取子节点信息:
-- 查询总公司(id=1)的所有子节点 SELECT d.*, dc.depth FROM department d INNER JOIN department_closure dc ON d.id = dc.descendant_id WHERE dc.ancestor_id = 1 AND dc.depth > 0;
查询某个节点的所有父节点
查询“技术部”的所有父节点,只需要查询闭包表中descendant_id为技术部ID,且depth大于0的记录,关联部门表获取父节点信息:
-- 查询技术部(id=2)的所有父节点 SELECT d.*, dc.depth FROM department d INNER JOIN department_closure dc ON d.id = dc.ancestor_id WHERE dc.descendant_id = 2 AND dc.depth > 0 ORDER BY dc.depth DESC;
查询某个节点的直接子节点
直接子节点的特点是depth为1,所以查询条件加上depth=1即可:
-- 查询总公司(id=1)的直接子节点 SELECT d.* FROM department d INNER JOIN department_closure dc ON d.id = dc.descendant_id WHERE dc.ancestor_id = 1 AND dc.depth = 1;
查询两个节点的层级距离
直接查询闭包表中ancestor_id为上级节点ID,descendant_id为下级节点ID的depth值即可:
-- 查询总公司到技术部的层级距离 SELECT depth FROM department_closure WHERE ancestor_id = 1 AND descendant_id = 2;
闭包表与邻接表的对比
我们可以通过下表对比两种方案的优劣:
| 对比维度 | 邻接表方案 | 闭包表方案 |
|---|---|---|
| 存储方式 | 节点表加父节点ID字段 | 节点表加独立的关系表 |
| 查询子节点/父节点 | 需要递归查询,性能差 | 关联查询,性能优 |
| 插入节点复杂度 | 简单,只需更新父节点ID | 复杂,需要插入多条路径关系 |
| 存储空间 | 小,只多一个字段 | 大,关系表数据量是O(n²)级别 |
| 适用场景 | 树深度小、查询少、数据量小 | 树深度大、层级查询频繁、数据量中等 |
闭包表的注意事项
- 插入节点时需要正确维护闭包关系表,避免遗漏路径导致查询错误,建议把插入逻辑封装成存储过程或者业务代码中的统一方法。
- 删除节点时,需要根据业务需求处理子节点,比如如果删除的是中间节点,可以选择把子节点挂到被删除节点的父节点下,或者直接删除所有子节点,同时删除闭包表中对应的所有关系。
- 如果树状结构变更不频繁,但是层级查询非常频繁,闭包表的优势会非常明显;如果树结构经常变更,需要评估插入和维护关系的性能开销。
闭包表是一种用空间换时间的优化方案,在设计树状结构存储时,需要根据业务的读写比例、数据量大小、树深度等因素综合选择是否使用闭包表。