在使用 MongoDB 搭配 Mongoose 开发项目时,文档之间经常通过引用字段建立关联关系,比如文章集合的 category 字段引用分类集合的 _id。有时候我们需要筛选出某个集合中从未被其他文档引用的文档,比如找出没有被任何文章使用的分类,或者没有被任何订单关联的商品。

方法一:使用聚合管道查询
聚合管道是 MongoDB 原生支持的查询方式,Mongoose 也对其做了良好的封装,我们可以通过 $lookup 操作符关联引用当前集合的其他集合,再通过 $match 筛选出关联结果为空的文档。
假设我们有两个集合,分类集合 Category 和文章集合 Article,Article 的 category 字段存储 Category 的 _id,现在要查找所有未被 Article 引用的 Category 文档。
首先定义两个 Schema:
const mongoose = require('mongoose');
// 分类Schema
const categorySchema = new mongoose.Schema({
name: String,
createTime: { type: Date, default: Date.now }
});
const Category = mongoose.model('Category', categorySchema);
// 文章Schema
const articleSchema = new mongoose.Schema({
title: String,
content: String,
category: { type: mongoose.Schema.Types.ObjectId, ref: 'Category' },
createTime: { type: Date, default: Date.now }
});
const Article = mongoose.model('Article', articleSchema);
接下来使用聚合管道查询未被引用的分类:
async function findUnreferencedCategories() {
try {
const result = await Category.aggregate([
// 关联Article集合,查找引用当前分类的文章
{
$lookup: {
from: 'articles', // 要关联的集合名称,注意是数据库中的集合名,默认是模型名小写加s
localField: '_id', // 当前集合的关联字段
foreignField: 'category', // 其他集合中引用当前集合的字段
as: 'refArticles' // 关联结果存放的字段名
}
},
// 筛选出关联结果为空的文档
{
$match: {
refArticles: { $size: 0 }
}
},
// 可选:移除临时添加的关联结果字段
{
$project: {
refArticles: 0
}
}
]);
console.log('未被引用的分类:', result);
return result;
} catch (err) {
console.error('查询失败:', err);
}
}
方法二:先获取引用ID再筛选
如果关联的文档数量不多,也可以先查询出所有引用当前集合的文档的关联ID,再在集合中筛选出 _id 不在这些ID中的文档,这种方式逻辑更直观,适合简单场景。
还是以上面的 Category 和 Article 为例,实现代码如下:
async function findUnreferencedCategories2() {
try {
// 第一步:获取所有被文章引用的分类ID
const referencedCategoryIds = await Article.distinct('category');
// 第二步:查询_id不在引用ID列表中的分类
const unreferencedCategories = await Category.find({
_id: { $nin: referencedCategoryIds }
});
console.log('未被引用的分类:', unreferencedCategories);
return unreferencedCategories;
} catch (err) {
console.error('查询失败:', err);
}
}
两种方法的对比
我们可以通过下面的表格对比两种方法的适用场景:
| 方法 | 优势 | 劣势 | 适用场景 |
|---|---|---|---|
| 聚合管道查询 | 单次查询完成,不需要多次数据库交互,性能较好 | 语法相对复杂,需要了解聚合操作符 | 数据量大、关联逻辑复杂的场景 |
| 先查引用ID再筛选 | 逻辑简单易懂,代码可读性高 | 需要两次数据库查询,数据量大时引用ID列表可能过长 | 数据量小、逻辑简单的场景 |
注意事项
- 使用
$lookup时,from 字段需要填写数据库中的实际集合名,Mongoose 模型默认的集合名是模型名首字母小写加 s,如果自定义了集合名需要填写自定义的名称。 - 如果引用字段可能存在空值,需要在查询时额外处理,避免空值影响筛选结果。
- 如果关联的文档数量非常多,聚合管道查询时可以考虑添加索引提升查询性能,比如在 Article 的 category 字段上添加索引。
总结
查找 Mongoose 集合中未被其他文档引用的文档,核心思路都是先找到所有被引用的文档ID,再筛选出不在该列表中的文档。聚合管道方式适合复杂和高性能要求的场景,先查ID再筛选的方式适合简单场景,开发者可以根据实际需求选择合适的方法。在实际开发中,还可以根据业务需求对查询逻辑进行扩展,比如添加时间范围筛选、分页等能力。