在MongoDB的实际业务场景中,很多文档会包含嵌套的数组结构,比如订单文档中包含多个商品子项,用户文档中包含多条地址记录。当需要筛选出数组中符合特定条件的所有元素,同时保留文档的其他原有字段时,普通的查询操作很难满足需求,这时候就需要借助聚合管道来完成操作。

常见的嵌套数组筛选场景
假设我们有一个存储学生选课信息的集合student_courses,每个文档的结构如下,其中courses就是嵌套的数组字段,包含学生选择的所有课程信息:
{
"_id": 1,
"name": "张三",
"age": 20,
"courses": [
{"course_id": 101, "course_name": "数学", "score": 85, "status": "passed"},
{"course_id": 102, "course_name": "英语", "score": 72, "status": "passed"},
{"course_id": 103, "course_name": "物理", "score": 58, "status": "failed"},
{"course_id": 104, "course_name": "化学", "score": 90, "status": "passed"}
]
},
{
"_id": 2,
"name": "李四",
"age": 21,
"courses": [
{"course_id": 101, "course_name": "数学", "score": 92, "status": "passed"},
{"course_id": 103, "course_name": "物理", "score": 65, "status": "passed"}
]
}
现在的需求是:筛选出所有成绩大于等于60分(即及格)的课程,同时保留学生的姓名、年龄等原有字段,并且数组内的所有及格课程都要保留,不能只保留第一条。
使用聚合管道的$project和$filter操作符实现
MongoDB的聚合管道中,$filter操作符专门用于对数组进行筛选,它会遍历数组的每个元素,根据指定的条件返回符合条件的所有元素,正好符合我们的需求。我们可以结合$project阶段来重构文档,保留需要的字段并更新courses数组。
具体聚合操作步骤
第一步使用$project阶段,在$project中通过$filter对courses数组进行筛选,筛选条件是score >= 60,同时保留name和age字段。
完整的聚合查询代码如下:
db.student_courses.aggregate([
{
$project: {
name: 1,
age: 1,
// 使用$filter筛选courses数组
courses: {
$filter: {
input: "$courses", // 要筛选的数组
as: "course", // 数组元素的临时变量名
cond: { $gte: ["$$course.score", 60] } // 筛选条件:成绩大于等于60
}
}
}
}
])
代码说明
$project:用于指定输出文档中包含的字段,1表示保留该字段,0表示排除。$filter:数组筛选操作符,包含三个参数:input是要处理的数组字段,as是遍历数组时每个元素的临时变量名,cond是筛选条件表达式。$$course.score:这里的$$前缀表示引用as定义的临时变量,获取每个数组元素的score字段值。
查询结果展示
执行上述聚合查询后,得到的结果如下,可以看到每个学生的courses数组只保留了成绩大于等于60的课程,其他字段都正常保留:
[
{
"_id": 1,
"name": "张三",
"age": 20,
"courses": [
{"course_id": 101, "course_name": "数学", "score": 85, "status": "passed"},
{"course_id": 102, "course_name": "英语", "score": 72, "status": "passed"},
{"course_id": 104, "course_name": "化学", "score": 90, "status": "passed"}
]
},
{
"_id": 2,
"name": "李四",
"age": 21,
"courses": [
{"course_id": 101, "course_name": "数学", "score": 92, "status": "passed"},
{"course_id": 103, "course_name": "物理", "score": 65, "status": "passed"}
]
}
]
更复杂的筛选条件示例
如果筛选条件更复杂,比如需要筛选成绩大于等于60且课程状态为passed的课程,只需要修改$filter的cond条件即可,多个条件可以使用$and操作符组合:
db.student_courses.aggregate([
{
$project: {
name: 1,
age: 1,
courses: {
$filter: {
input: "$courses",
as: "course",
cond: {
$and: [
{ $gte: ["$$course.score", 60] },
{ $eq: ["$$course.status", "passed"] }
]
}
}
}
}
}
])
这种写法同样会保留所有符合两个条件的数组元素,满足更复杂的业务筛选需求。
注意事项
- 如果原文档中
courses数组为空,或者没有符合筛选条件的元素,那么courses字段会返回空数组,不会报错。 $filter不会修改原数组的元素结构,只会过滤元素,如果需要同时修改数组内元素的结构,可以结合$map操作符一起使用。- 聚合管道的阶段顺序很重要,如果有其他筛选文档的需求,可以先使用
$match阶段过滤符合条件的文档,再使用$project和$filter处理数组,提升查询效率。