在电商业务场景中,商品往往存在多个变量属性,比如不同规格、不同批次的商品都会对应不同的价格,当数据量达到几十万甚至上百万级别时,需要快速统计不同价格区间内的商品变量数量,传统的for循环遍历方式不仅代码冗长,处理效率也无法满足要求。Stream API提供了声明式的集合操作能力,能够高效完成这类动态聚合需求。

核心实现思路
实现价格区间动态聚合的核心步骤分为三步:首先是定义可动态配置的价格区间规则,避免硬编码区间范围;其次是将商品变量数据映射为价格数值,同时过滤掉无效的价格数据;最后通过分组收集器完成区间匹配和数量统计,还可以根据需求对结果进行排序或二次处理。
1. 定义价格区间配置类
为了支持动态配置价格区间,首先创建一个区间描述类,包含区间下限、上限和区间名称,方便后续扩展和调整区间范围。
import java.math.BigDecimal;
/**
* 价格区间配置类
*/
public class PriceRange {
// 区间下限,null表示无下限
private BigDecimal min;
// 区间上限,null表示无上限
private BigDecimal max;
// 区间描述名称
private String rangeName;
public PriceRange(BigDecimal min, BigDecimal max, String rangeName) {
this.min = min;
this.max = max;
this.rangeName = rangeName;
}
/**
* 判断价格是否属于当前区间
*/
public boolean contains(BigDecimal price) {
if (price == null) {
return false;
}
// 校验下限:如果min为null,说明不限制下限
boolean minMatch = min == null || price.compareTo(min) >= 0;
// 校验上限:如果max为null,说明不限制上限
boolean maxMatch = max == null || price.compareTo(max) < 0;
return minMatch && maxMatch;
}
// getter方法
public BigDecimal getMin() {
return min;
}
public BigDecimal getMax() {
return max;
}
public String getRangeName() {
return rangeName;
}
}
2. 商品变量数据模型
定义商品变量的基础数据模型,包含商品ID、变量属性和价格字段,实际业务中可以根据需要扩展更多字段。
import java.math.BigDecimal;
/**
* 商品变量数据模型
*/
public class ProductVariant {
// 商品ID
private Long productId;
// 变量属性,比如颜色、尺寸等
private String variantAttr;
// 变量价格
private BigDecimal price;
public ProductVariant(Long productId, String variantAttr, BigDecimal price) {
this.productId = productId;
this.variantAttr = variantAttr;
this.price = price;
}
// getter方法
public Long getProductId() {
return productId;
}
public String getVariantAttr() {
return variantAttr;
}
public BigDecimal getPrice() {
return price;
}
}
3. 基于Stream API的聚合实现
下面的代码演示了如何结合Stream API完成价格区间的动态聚合,支持自定义区间配置,同时过滤掉价格为空或小于0的无效数据。
import java.math.BigDecimal;
import java.util.*;
import java.util.stream.Collectors;
public class PriceRangeAggregator {
/**
* 对商品变量列表进行价格区间聚合
* @param variants 商品变量数据列表
* @param ranges 动态配置的价格区间列表
* @return 区间名称到商品数量的映射
*/
public static Map<String, Long> aggregatePriceRange(List<ProductVariant> variants, List<PriceRange> ranges) {
// 校验入参
if (variants == null || variants.isEmpty() || ranges == null || ranges.isEmpty()) {
return Collections.emptyMap();
}
// 使用Stream API处理数据
return variants.stream()
// 过滤无效价格:价格不为空且大于等于0
.filter(variant -> variant.getPrice() != null && variant.getPrice().compareTo(BigDecimal.ZERO) >= 0)
// 将每个商品变量匹配到对应的价格区间,匹配不到的归到"其他"区间
.map(variant -> {
for (PriceRange range : ranges) {
if (range.contains(variant.getPrice())) {
return range.getRangeName();
}
}
return "其他";
})
// 按区间名称分组,统计每个区间的商品数量
.collect(Collectors.groupingBy(
rangeName -> rangeName,
Collectors.counting()
));
}
public static void main(String[] args) {
// 1. 准备测试数据:100万条商品变量数据
List<ProductVariant> testVariants = new ArrayList<>();
Random random = new Random();
for (long i = 0; i < 1000000; i++) {
// 生成0-10000之间的随机价格
BigDecimal price = new BigDecimal(random.nextInt(10000));
testVariants.add(new ProductVariant(i, "规格" + i, price));
}
// 2. 定义动态价格区间
List<PriceRange> priceRanges = Arrays.asList(
new PriceRange(null, new BigDecimal("100"), "100元以下"),
new PriceRange(new BigDecimal("100"), new BigDecimal("500"), "100-500元"),
new PriceRange(new BigDecimal("500"), new BigDecimal("2000"), "500-2000元"),
new PriceRange(new BigDecimal("2000"), null, "2000元以上")
);
// 3. 执行聚合操作
Map<String, Long> result = aggregatePriceRange(testVariants, priceRanges);
// 4. 输出聚合结果,按区间名称排序
result.entrySet().stream()
.sorted(Map.Entry.comparingByKey())
.forEach(entry -> System.out.println(entry.getKey() + ":" + entry.getValue() + "个商品变量"));
}
}
并行流优化处理
当商品变量数据量非常大时,可以使用并行流进一步提升处理效率,只需要将stream()替换为parallelStream()即可,但需要注意并行流的使用场景:
- 数据量较小的时候不建议使用并行流,线程切换的开销反而会拖慢处理速度
- 确保数据操作是无状态的,避免共享变量的线程安全问题
- 如果下游还有顺序依赖的逻辑,需要额外处理结果的顺序问题
调整后的并行流处理代码如下:
// 并行流版本的价格区间聚合
public static Map<String, Long> aggregatePriceRangeParallel(List<ProductVariant> variants, List<PriceRange> ranges) {
if (variants == null || variants.isEmpty() || ranges == null || ranges.isEmpty()) {
return Collections.emptyMap();
}
return variants.parallelStream()
.filter(variant -> variant.getPrice() != null && variant.getPrice().compareTo(BigDecimal.ZERO) >= 0)
.map(variant -> {
for (PriceRange range : ranges) {
if (range.contains(variant.getPrice())) {
return range.getRangeName();
}
}
return "其他";
})
.collect(Collectors.groupingBy(
rangeName -> rangeName,
Collectors.counting()
));
}
注意事项
在实际使用过程中需要注意以下几点:
- 价格字段建议使用
BigDecimal类型,避免使用double或float导致的精度丢失问题 - 动态区间配置需要注意区间之间不要重叠,否则会导致商品变量被重复统计到多个区间
- 如果需要对聚合结果进行更多维度的统计,比如区间内的平均价格、最高价格,可以自定义收集器实现,不需要多次遍历数据
- 当价格区间经常变动时,可以将区间配置放到配置文件或数据库中,修改时不需要调整代码逻辑
Stream_API价格区间聚合商品变量数据Java集合处理修改时间:2026-06-13 06:21:47