HashSet是Java集合体系中典型的利用组合模式实现功能的类,它在内部并没有自己维护一套独立的元素存储结构,而是封装了一个HashMap实例,所有和元素存储、去重相关的操作,最终都委托给这个HashMap来完成。这种设计既复用了HashMap成熟的键值对存储能力,又简化了HashSet自身的实现逻辑。

HashSet内部的HashMap变量定义
我们可以先看HashSet源码中对HashMap变量的定义,核心部分如下:
// HashSet内部封装的HashMap实例,用于存储元素
private transient HashMap<E,Object> map;
// 作为HashMap中所有value的占位对象,因为HashSet只关心key,不关心value
private static final Object PRESENT = new Object();
// 无参构造器,初始化HashMap实例
public HashSet() {
map = new HashMap<>();
}
从定义可以看出,HashSet的泛型参数E只作为HashMap的键类型,而所有HashMap的值都指向同一个静态常量PRESENT,这个对象没有实际业务意义,只是用来填充HashMap的值位置,因为HashMap要求每个键必须对应一个值。
添加元素的去重逻辑实现
HashSet的add方法是最常用的操作,其去重能力完全依赖HashMap的键唯一性特性,源码实现如下:
public boolean add(E e) {
// 调用map的put方法,键为要添加的元素,值为占位对象PRESENT
// 如果键已经存在,put方法会返回旧值,否则返回null
return map.put(e, PRESENT) == null;
}
这里的核心逻辑是:HashMap的键是不允许重复的,如果尝试添加一个已经存在的键,put方法不会更新键,只会返回旧的值。而HashSet的add方法判断map.put的返回值是否为null,如果为null说明这个键之前不存在,添加成功;如果不为null说明键已经存在,添加失败,这就实现了去重的效果。
其他核心操作的委托逻辑
除了添加元素,HashSet的其他常用操作也都是委托给内部的HashMap完成的:
- 判断元素是否存在:调用
map.containsKey(Object o)方法,检查对应的键是否在HashMap中 - 删除元素:调用
map.remove(Object o)方法,删除对应的键和关联的占位值 - 获取集合大小:调用
map.size()方法,返回HashMap中键值对的数量 - 清空集合:调用
map.clear()方法,清空HashMap中的所有键值对
对应的源码片段如下:
// 判断元素是否存在
public boolean contains(Object o) {
return map.containsKey(o);
}
// 删除元素
public boolean remove(Object o) {
// 删除键对应的键值对,如果返回值是PRESENT说明删除成功
return map.remove(o) == PRESENT;
}
// 获取集合大小
public int size() {
return map.size();
}
// 清空集合
public void clear() {
map.clear();
}
组合模式设计的优势
HashSet采用组合模式封装HashMap的设计有很多优势:
- 代码复用:不需要自己实现哈希表、哈希冲突处理、扩容等复杂逻辑,直接复用HashMap成熟稳定的实现
- 职责清晰:HashSet只需要关注自身作为集合的接口定义,底层存储逻辑完全交给HashMap,符合单一职责原则
- 维护成本低:如果HashMap后续有性能优化或者功能迭代,HashSet不需要修改代码就能享受到对应的优化效果
注意事项
因为HashSet的去重完全依赖HashMap的键特性,所以存放在HashSet中的元素必须正确实现hashCode()和equals()方法,否则会出现两个逻辑上相同的元素被判定为不同键,导致去重失效的情况。同时HashSet不保证元素的迭代顺序,也不保证顺序随时间不变,这也是因为底层的HashMap本身就不保证键的存储顺序。