如何在Java中按数量限制移除ArrayList中的重复元素？

来源：IPIPP.com作者：陈平安头衔：全栈工程师

导读：本期聚焦于小伙伴创作的《如何在Java中按数量限制移除ArrayList中的重复元素？》，敬请观看详情，探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《如何在Java中按数量限制移除ArrayList中的重复元素？》有用，将其分享出去将是对创作者最好的鼓励。

从ArrayList中根据数量移除重复项的教程

在实际的Java开发场景中，我们经常会遇到需要处理ArrayList集合中重复元素的需求。有时候不是要完全去重，而是要保留出现次数不超过指定数量的重复项，移除超出数量限制的重复元素。本文将详细介绍几种实现该需求的方法，并给出对应的代码示例。

方法一：使用HashMap统计次数后筛选

这种思路的核心是先遍历一次ArrayList，用HashMap记录每个元素出现的次数，然后再遍历一次集合，根据统计的次数和设定的阈值，移除超出数量的重复项。需要注意的是，遍历集合的同时修改集合结构容易引发并发修改异常，因此建议使用迭代器或者倒序遍历的方式来操作。

下面是具体的实现代码：

import java.util.ArrayList;
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;

public class ArrayListRemoveDuplicateByCount {
    public static void main(String[] args) {
        // 初始化测试用的ArrayList，包含重复元素
        ArrayList<String> list = new ArrayList<>();
        list.add("apple");
        list.add("banana");
        list.add("apple");
        list.add("orange");
        list.add("apple");
        list.add("banana");
        list.add("grape");

        // 设定允许的最大重复次数，这里设置为2，即每个元素最多保留2个
        int maxCount = 2;
        System.out.println("处理前的集合：" + list);

        // 调用方法移除超出数量的重复项
        removeDuplicateByCount(list, maxCount);

        System.out.println("处理后的集合：" + list);
    }

    /**
     * 根据指定数量移除ArrayList中的重复项
     * @param list 待处理的ArrayList集合
     * @param maxCount 允许每个元素保留的最大数量
     */
    public static void removeDuplicateByCount(ArrayList<String> list, int maxCount) {
        // 用HashMap统计每个元素出现的次数
        Map<String, Integer> countMap = new HashMap<>();
        for (String item : list) {
            countMap.put(item, countMap.getOrDefault(item, 0) + 1);
        }

        // 使用迭代器遍历集合，避免并发修改异常
        Iterator<String> iterator = list.iterator();
        // 临时Map记录已经保留的元素数量
        Map<String, Integer> keepCountMap = new HashMap<>();
        while (iterator.hasNext()) {
            String current = iterator.next();
            // 获取当前元素允许的最大数量
            int allowedCount = countMap.get(current);
            // 如果允许的数量不超过maxCount，直接保留
            if (allowedCount <= maxCount) {
                continue;
            }
            // 统计当前已经保留的该元素的数量
            int keepCount = keepCountMap.getOrDefault(current, 0);
            if (keepCount < maxCount) {
                // 还没达到保留上限，计数加1
                keepCountMap.put(current, keepCount + 1);
            } else {
                // 已经达到保留上限，移除当前元素
                iterator.remove();
            }
        }
    }
}

运行上述代码后，输出结果如下：

处理前的集合：[apple, banana, apple, orange, apple, banana, grape]
处理后的集合：[apple, banana, apple, orange, banana, grape]

可以看到，原本出现3次的"apple"被移除了1个，最终只保留2个，符合我们设定的maxCount阈值。

方法二：倒序遍历集合移除元素

除了使用迭代器，我们还可以通过倒序遍历ArrayList的方式来处理，因为倒序遍历时移除元素不会影响前面未遍历元素的索引，从而避免并发修改异常的问题。这种方法的实现逻辑和第一种类似，只是遍历方式不同。

具体代码如下：

import java.util.ArrayList;
import java.util.HashMap;
import java.util.Map;

public class ArrayListRemoveDuplicateByCount2 {
    public static void main(String[] args) {
        ArrayList<String> list = new ArrayList<>();
        list.add("apple");
        list.add("banana");
        list.add("apple");
        list.add("orange");
        list.add("apple");
        list.add("banana");
        list.add("grape");

        int maxCount = 2;
        System.out.println("处理前的集合：" + list);

        removeDuplicateByCountReverse(list, maxCount);

        System.out.println("处理后的集合：" + list);
    }

    /**
     * 倒序遍历方式移除超出数量的重复项
     * @param list 待处理的ArrayList集合
     * @param maxCount 允许每个元素保留的最大数量
     */
    public static void removeDuplicateByCountReverse(ArrayList<String> list, int maxCount) {
        // 统计每个元素的总出现次数
        Map<String, Integer> countMap = new HashMap<>();
        for (String item : list) {
            countMap.put(item, countMap.getOrDefault(item, 0) + 1);
        }

        // 倒序遍历集合
        for (int i = list.size() - 1; i >= 0; i--) {
            String current = list.get(i);
            int totalCount = countMap.get(current);
            // 如果总次数不超过阈值，不需要处理
            if (totalCount <= maxCount) {
                continue;
            }
            // 计算当前元素需要保留的数量，倒序遍历时，先遇到的是后面的元素，优先保留
            // 统计当前元素在倒序遍历中已经遇到的数量
            int keepCount = 0;
            for (int j = list.size() - 1; j > i; j--) {
                if (list.get(j).equals(current)) {
                    keepCount++;
                }
            }
            // 如果已经保留的数量达到阈值，移除当前元素
            if (keepCount >= maxCount) {
                list.remove(i);
            }
        }
    }
}

这种方法的运行结果和第一种方法一致，不过倒序遍历的方式在逻辑上更直观，不需要额外维护保留数量的Map，但是内部嵌套了一层循环，在数据量较大的时候性能会比第一种方法稍差一些。

两种方法的对比与选择

我们可以通过下面的表格对比两种方法的优缺点，方便根据实际场景选择：

方法	优点	缺点	适用场景
HashMap+迭代器	时间复杂度低，只需要两次遍历，性能较好	需要额外维护两个Map，内存占用稍高	数据量大，对性能要求高的场景
倒序遍历	逻辑简单，不需要额外维护复杂的状态Map	嵌套循环，数据量大时性能较差	数据量小，追求代码简洁的场景

注意事项

在使用上述方法时，需要注意几个问题：

如果ArrayList中存储的是自定义对象，需要保证对象正确重写了equals()和hashCode()方法，否则HashMap统计次数时会出现错误，因为HashMap判断键是否相等依赖这两个方法。
如果设定的maxCount小于1，那么所有元素都会被移除，使用时需要根据实际需求做参数校验，避免出现不符合预期的结果。
如果集合是多线程环境下使用的，上述方法都不是线程安全的，需要额外加锁或者使用并发集合来处理。

另外，如果需要完全去重，也就是maxCount设为1，也可以直接使用HashSet的特性，不过HashSet会丢失原有顺序，如果需要保留顺序可以使用LinkedHashSet，但是本文的场景是根据数量保留重复项，所以上述两种方法更通用。

Java ArrayList remove_duplicates HashMap iteration count_limit修改时间：2026-05-24 13:31:44

免责声明：已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰，观点力求客观中立。本站旨在免费分享，内容仅供个人学习、研究或参考使用。若引用了第三方作品，版权归原作者所有。如内容涉及您的权益，请联系我们处理。