在SQL查询过程中,我们经常会遇到需要筛选某个字段值属于多个指定值的情况,比如查询用户表中城市为北京、上海、广州的所有用户,或者查询订单表中状态为已支付、已发货、已完成的所有订单。如果直接使用OR关键字连接多个等于判断,语句会变得非常冗长,而IN子句可以完美解决这个问题,让多条件判断的逻辑更清晰,语句更简洁。

IN子句的基础语法
IN子句的基本语法格式如下,用于判断某个字段的值是否存在于指定的集合当中:
-- 基础语法 SELECT 列名1, 列名2, ... FROM 表名 WHERE 字段名 IN (值1, 值2, 值3, ...);
这里的集合可以是直接列举的常量值,也可以是子查询返回的结果集。当字段的值和集合中的任意一个值匹配时,该条记录就会被筛选出来。
IN子句对比OR的简化效果
我们用一个实际的用户表user_info来举例,表结构包含user_id、user_name、city三个字段,现在需要查询城市为北京、上海、广州的所有用户信息。
如果使用OR关键字编写查询语句,代码会像下面这样:
-- 使用OR的多条件查询 SELECT user_id, user_name, city FROM user_info WHERE city = '北京' OR city = '上海' OR city = '广州';
当筛选的城市数量变多时,OR连接的语句会越来越长,可读性也会下降。而使用IN子句的话,语句可以简化为:
-- 使用IN子句的等价查询
SELECT user_id, user_name, city
FROM user_info
WHERE city IN ('北京', '上海', '广州');
可以看到,IN子句把多个OR条件合并成了一个判断,语句更简洁,后续如果需要新增筛选的城市,只需要在IN后面的集合中添加对应值即可,维护起来更方便。
IN子句结合子查询使用
IN后面的集合除了可以是常量值,还可以是子查询返回的结果集,这在需要关联其他表筛选数据的场景中非常常用。比如我们有一个订单表order_info,包含order_id、user_id、order_status字段,现在需要查询所有下过订单的用户的基础信息。
首先可以通过子查询从order_info表中查出所有有订单的user_id,再把这些user_id作为集合放到IN子句中进行筛选:
-- IN结合子查询使用
SELECT user_id, user_name, city
FROM user_info
WHERE user_id IN (
SELECT DISTINCT user_id
FROM order_info
);
这里子查询返回的是所有下过订单的用户ID集合,外层查询会筛选出user_id在这个集合中的所有用户信息,实现了跨表的数据筛选。
IN子句的使用注意事项
NULL值的处理
如果IN后面的集合中包含NULL值,需要注意判断逻辑:如果字段的值本身为NULL,那么使用IN判断时不会返回该条记录,因为NULL和任何值比较的结果都是NULL,不会被判定为匹配。比如下面的查询不会返回city为NULL的用户:
-- 包含NULL的集合查询
SELECT user_id, user_name, city
FROM user_info
WHERE city IN ('北京', '上海', NULL);
如果需要筛选字段为NULL的记录,需要单独使用IS NULL判断,不能放在IN的集合中。
效率对比说明
在大多数数据库的执行引擎中,IN子句和等价的OR语句执行效率是一致的,数据库会对两者做相同的优化,所以不需要担心使用IN会带来额外的性能损耗。但如果IN后面的集合值非常多,比如超过几千个,可能会影响查询效率,这种场景下可以考虑把集合值放到临时表中,再通过JOIN的方式关联查询。
常见使用场景总结
IN子句在日常SQL查询中适用的场景非常多,常见的有:
- 筛选字段值属于多个指定枚举值的记录,比如订单状态、用户等级、商品分类等
- 结合子查询实现跨表数据筛选,避免写复杂的多表JOIN语句
- 批量删除或更新符合多个指定ID的记录,比如删除user_id在指定集合中的用户数据
只要遇到需要判断字段值是否在多个指定值中的场景,都可以优先考虑使用IN子句来简化查询逻辑,让SQL语句更易读易维护。