如何快速获取SQL表中的不重复值：DISTINCT与分组该怎么选

来源：IT编程作者：桃乃木香奈头衔：网络博主

导读：本期聚焦于小伙伴创作的《如何快速获取SQL表中的不重复值：DISTINCT与分组该怎么选》，敬请观看详情，探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《如何快速获取SQL表中的不重复值：DISTINCT与分组该怎么选》有用，将其分享出去将是对创作者最好的鼓励。

在SQL查询的实际开发中，经常需要从表中提取某一列或多列的不重复值，常见实现方式有两种，分别是使用DISTINCT关键字和GROUP BY分组语句。两种方式都能达成去重目标，但适用场景和底层逻辑有所不同，需要根据实际需求选择。

DISTINCT的基本用法

DISTINCT是SQL中专门用于去重的关键字，直接作用于SELECT后面的字段，会对查询结果中所有选中字段的组合进行去重，保留完全不重复的记录行。

假设有一张用户表user，其中包含city字段，需要获取所有不重复的城市名称，语法如下：

-- 查询user表中所有不重复的城市
SELECT DISTINCT city
FROM user;

如果需要同时获取不重复的省份和城市组合，可以对多个字段使用DISTINCT：

-- 查询不重复的省份+城市组合
SELECT DISTINCT province, city
FROM user;

GROUP BY的核心作用是对数据进行分组聚合，当仅对字段进行分组而不使用聚合函数时，也能实现去重效果，每个分组只会保留一条记录。

同样获取user表中不重复的城市名称，使用GROUP BY的写法如下：

-- 使用GROUP BY查询不重复的城市
SELECT city
FROM user
GROUP BY city;

获取不重复的省份和城市组合：

-- 使用GROUP BY查询不重复的省份+城市组合
SELECT province, city
FROM user
GROUP BY province, city;

两种方式虽然都能实现去重，但在多个维度存在区别，具体对比如下：

在大多数数据库引擎中，仅进行简单去重时，DISTINCT和GROUP BY的执行计划基本一致，性能差异可以忽略。但如果需要同时统计每组的记录数，优先选择GROUP BY，因为可以直接搭配COUNT函数：

-- 查询每个城市对应的用户数量，同时去重城市
SELECT city, COUNT(*) AS user_count
FROM user
GROUP BY city;

如果只需要获取不重复值，没有统计需求，使用DISTINCT语义更清晰，代码可读性更高。需要注意，DISTINCT会对所有选中字段的组合去重，不要误以为仅对第一个字段去重。另外，对包含NULL值的字段使用去重时，NULL会被视为一个独立的重复值组，最终会保留一条NULL记录。

注意：不要在DISTINCT后面加括号包裹字段，比如DISTINCT (city)是错误写法，正确写法为DISTINCT city。

根据实际业务需求选择合适的方式，既能保证查询逻辑清晰，也能获得更好的执行效率。如果后续需要对去重后的结果做进一步筛选，两种方式都可以在外层嵌套查询或者使用HAVING子句（GROUP BY场景）实现。

免责声明：已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰，观点力求客观中立。本站旨在免费分享，内容仅供个人学习、研究或参考使用。若引用了第三方作品，版权归原作者所有。如内容涉及您的权益，请联系我们处理。