MySQL查询重复数据详解：利用SQL JOIN高效排查与处理重复记录

来源：站长平台作者：陈平安头衔：全栈工程师

导读：本期聚焦于小伙伴创作的《MySQL查询重复数据详解：利用SQL JOIN高效排查与处理重复记录》，敬请观看详情，探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《MySQL查询重复数据详解：利用SQL JOIN高效排查与处理重复记录》有用，将其分享出去将是对创作者最好的鼓励。

解决MySQL查询重复数据问题：理解与应用SQL JOIN

在MySQL数据库的日常使用中，查询重复数据是常见的需求场景，比如统计表中重复的用户手机号、排查订单表中重复的交易记录等。很多开发者在初次遇到这类需求时，容易写出逻辑错误的查询语句，导致结果不符合预期。本文将结合SQL JOIN操作，讲解如何高效查询并处理MySQL中的重复数据问题。

重复数据的常见场景与基础判断

首先我们需要明确什么是表中的重复数据：通常是指表中存在两条或更多条记录，除了主键（或唯一标识字段）之外，其他核心字段的值完全相同。比如下方这张用户表user_info的示例数据：

id	username	phone	register_time
1	张三	13800138000	2024-01-01 10:00:00
2	李四	13800138000	2024-01-02 11:00:00
3	王五	13900139000	2024-01-03 12:00:00
4	赵六	13800138000	2024-01-04 13:00:00

上述表中，phone字段为13800138000的记录有3条，属于重复数据，而13900139000仅1条，不属于重复。要查询这类重复数据，最基础的方式是使用GROUP BY结合聚合函数，示例如下：

-- 查询重复的手机号及重复次数
SELECT phone, COUNT(*) AS repeat_count
FROM user_info
GROUP BY phone
HAVING COUNT(*) > 1;

上述语句会返回所有出现次数大于1的手机号及其重复次数，但仅能得到重复的字段值，无法获取重复记录的全部信息。如果需要查询所有重复记录的完整内容，就需要结合SQL JOIN操作实现。

使用INNER JOIN查询重复记录完整信息

INNER JOIN会返回两个表中符合连接条件的交集记录，我们可以利用这个特性，将原始表和查询出的重复字段值表进行连接，从而得到所有重复记录的完整信息。

以上面的user_info表为例，查询所有手机号重复的用户完整记录，SQL语句如下：

-- 查询所有手机号重复的用户完整记录
SELECT u.*
FROM user_info u
INNER JOIN (
    SELECT phone
    FROM user_info
    GROUP BY phone
    HAVING COUNT(*) > 1
) t ON u.phone = t.phone
ORDER BY u.phone, u.id;

上述语句的执行逻辑分为两步：

子查询先统计出所有重复的手机号，得到临时表t
将原始表u和临时表t通过phone字段进行INNER JOIN，匹配到的记录就是所有重复记录的完整信息

执行后可以得到id为1、2、4的三条记录，即所有手机号重复的用户数据。

使用LEFT JOIN排查重复数据的形成原因

有时候我们不仅需要查询重复数据，还需要排查重复数据的形成原因，比如是否存在同一用户短时间内重复提交注册的情况，这时候可以使用LEFT JOIN对比不同时间点的记录。

比如我们要查询同一手机号在24小时内重复注册的记录，SQL语句如下：

-- 查询24小时内同手机号重复注册的记录
SELECT 
    u1.id AS first_id,
    u1.phone,
    u1.register_time AS first_register_time,
    u2.id AS repeat_id,
    u2.register_time AS repeat_register_time,
    TIMESTAMPDIFF(HOUR, u1.register_time, u2.register_time) AS hour_diff
FROM user_info u1
LEFT JOIN user_info u2 
    ON u1.phone = u2.phone 
    AND u2.id > u1.id
    AND TIMESTAMPDIFF(HOUR, u1.register_time, u2.register_time) <= 24
WHERE u2.id IS NOT NULL
ORDER BY u1.phone, u1.register_time;

这里使用LEFT JOIN将同一手机号的不同记录进行关联，通过u2.id > u1.id避免重复匹配，再筛选出时间间隔在24小时内的记录，就能清晰看到重复注册的时间差信息。

处理重复数据的注意事项

在查询到重复数据后，如果需要删除重复记录，仅保留一条，也可以结合JOIN实现，示例如下（保留id最小的重复记录）：

-- 删除重复手机号中id不是最小的记录
DELETE u2
FROM user_info u1
INNER JOIN user_info u2 
    ON u1.phone = u2.phone 
    AND u2.id > u1.id;

需要注意，执行删除操作前一定要先通过查询语句确认待删除的数据是否正确，避免误删有效数据。另外，如果表数据量较大，建议先给连接字段（如phone）添加索引，提升JOIN查询的效率。

提示：如果需要在测试环境验证上述SQL，可以访问示例网站（https://www.ipipp.com）获取模拟数据表结构，或者直接按照本文给出的表结构创建测试表。

掌握SQL JOIN在重复数据查询场景中的应用，能够帮助开发者更灵活地应对各类数据统计和排查需求，避免写出逻辑冗余的查询语句，提升开发效率。

MySQL 重复数据 SQL JOIN INNER JOIN 数据排查修改时间：2026-04-29 09:03:34

免责声明：已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰，观点力求客观中立。本站旨在免费分享，内容仅供个人学习、研究或参考使用。若引用了第三方作品，版权归原作者所有。如内容涉及您的权益，请联系我们处理。