如何查找 Mongoose 集合中未被其他文档引用的文档

来源：站长查询作者：小鱼头衔：草根站长

导读：本期聚焦于小伙伴创作的《如何查找 Mongoose 集合中未被其他文档引用的文档》，敬请观看详情，探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《如何查找 Mongoose 集合中未被其他文档引用的文档》有用，将其分享出去将是对创作者最好的鼓励。

在使用 MongoDB 搭配 Mongoose 开发项目时，文档之间经常通过引用字段建立关联关系，比如文章集合的 category 字段引用分类集合的 _id。有时候我们需要筛选出某个集合中从未被其他文档引用的文档，比如找出没有被任何文章使用的分类，或者没有被任何订单关联的商品。

方法一：使用聚合管道查询

聚合管道是 MongoDB 原生支持的查询方式，Mongoose 也对其做了良好的封装，我们可以通过 $lookup 操作符关联引用当前集合的其他集合，再通过 $match 筛选出关联结果为空的文档。

假设我们有两个集合，分类集合 Category 和文章集合 Article，Article 的 category 字段存储 Category 的 _id，现在要查找所有未被 Article 引用的 Category 文档。

首先定义两个 Schema：

const mongoose = require('mongoose');

// 分类Schema
const categorySchema = new mongoose.Schema({
  name: String,
  createTime: { type: Date, default: Date.now }
});
const Category = mongoose.model('Category', categorySchema);

// 文章Schema
const articleSchema = new mongoose.Schema({
  title: String,
  content: String,
  category: { type: mongoose.Schema.Types.ObjectId, ref: 'Category' },
  createTime: { type: Date, default: Date.now }
});
const Article = mongoose.model('Article', articleSchema);

接下来使用聚合管道查询未被引用的分类：

async function findUnreferencedCategories() {
  try {
    const result = await Category.aggregate([
      // 关联Article集合，查找引用当前分类的文章
      {
        $lookup: {
          from: 'articles', // 要关联的集合名称，注意是数据库中的集合名，默认是模型名小写加s
          localField: '_id', // 当前集合的关联字段
          foreignField: 'category', // 其他集合中引用当前集合的字段
          as: 'refArticles' // 关联结果存放的字段名
        }
      },
      // 筛选出关联结果为空的文档
      {
        $match: {
          refArticles: { $size: 0 }
        }
      },
      // 可选：移除临时添加的关联结果字段
      {
        $project: {
          refArticles: 0
        }
      }
    ]);
    console.log('未被引用的分类:', result);
    return result;
  } catch (err) {
    console.error('查询失败:', err);
  }
}

方法二：先获取引用ID再筛选

如果关联的文档数量不多，也可以先查询出所有引用当前集合的文档的关联ID，再在集合中筛选出 _id 不在这些ID中的文档，这种方式逻辑更直观，适合简单场景。

还是以上面的 Category 和 Article 为例，实现代码如下：

async function findUnreferencedCategories2() {
  try {
    // 第一步：获取所有被文章引用的分类ID
    const referencedCategoryIds = await Article.distinct('category');
    // 第二步：查询_id不在引用ID列表中的分类
    const unreferencedCategories = await Category.find({
      _id: { $nin: referencedCategoryIds }
    });
    console.log('未被引用的分类:', unreferencedCategories);
    return unreferencedCategories;
  } catch (err) {
    console.error('查询失败:', err);
  }
}

两种方法的对比

我们可以通过下面的表格对比两种方法的适用场景：

方法	优势	劣势	适用场景
聚合管道查询	单次查询完成，不需要多次数据库交互，性能较好	语法相对复杂，需要了解聚合操作符	数据量大、关联逻辑复杂的场景
先查引用ID再筛选	逻辑简单易懂，代码可读性高	需要两次数据库查询，数据量大时引用ID列表可能过长	数据量小、逻辑简单的场景

注意事项

使用 $lookup 时，from 字段需要填写数据库中的实际集合名，Mongoose 模型默认的集合名是模型名首字母小写加 s，如果自定义了集合名需要填写自定义的名称。
如果引用字段可能存在空值，需要在查询时额外处理，避免空值影响筛选结果。
如果关联的文档数量非常多，聚合管道查询时可以考虑添加索引提升查询性能，比如在 Article 的 category 字段上添加索引。

总结

查找 Mongoose 集合中未被其他文档引用的文档，核心思路都是先找到所有被引用的文档ID，再筛选出不在该列表中的文档。聚合管道方式适合复杂和高性能要求的场景，先查ID再筛选的方式适合简单场景，开发者可以根据实际需求选择合适的方法。在实际开发中，还可以根据业务需求对查询逻辑进行扩展，比如添加时间范围筛选、分页等能力。

Mongoose 文档引用集合查询 populate修改时间：2026-06-29 12:33:27

免责声明：已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰，观点力求客观中立。本站旨在免费分享，内容仅供个人学习、研究或参考使用。若引用了第三方作品，版权归原作者所有。如内容涉及您的权益，请联系我们处理。