std::views::chunk_by是C++23标准引入的Range适配器,核心作用是将输入的连续序列按照相邻元素是否满足指定谓词逻辑,切分成多个连续的子范围,每个子范围内部的相邻元素都满足谓词条件,相邻子范围的交界处则不满足谓词条件。

std::views::chunk_by的基本语法
它的基本调用形式有两种,一种是通过管道运算符使用,另一种是直接调用构造函数使用,两种形式的效果完全一致。
#include <ranges>
#include <vector>
#include <iostream>
int main() {
std::vector<int> nums = {1, 2, 3, 5, 6, 8, 9, 10};
// 谓词:相邻元素差值小于等于1时属于同一组
auto predicate = [](int a, int b) {
return b - a <= 1;
};
// 管道形式使用
auto chunks1 = nums | std::views::chunk_by(predicate);
// 构造函数形式使用
auto chunks2 = std::views::chunk_by(nums, predicate);
return 0;
}
谓词函数的编写要求
传递给std::views::chunk_by的谓词函数需要接收两个参数,分别是序列中相邻的两个元素,返回值为bool类型,当返回true时表示这两个元素属于同一个子范围,返回false时表示需要在这两个元素之间切分。
需要注意的几点要求:
- 谓词的第一个参数对应序列中靠前的元素,第二个参数对应靠后的元素,顺序不能颠倒
- 谓词函数需要满足严格弱序要求,否则切分结果可能不符合预期
- 如果输入序列为空,那么chunk_by返回的结果也是空序列
- 如果输入序列只有一个元素,那么结果会包含一个只包含该元素的子范围
实际使用场景示例
场景1:按数值连续性切分整数序列
将连续递增且差值不超过1的整数分到同一组,不连续的部分单独成组,这是最常见的使用场景。
#include <ranges>
#include <vector>
#include <iostream>
int main() {
std::vector<int> data = {1, 2, 3, 5, 6, 8, 9, 10, 15};
auto is_continuous = [](int a, int b) {
return b - a <= 1;
};
for (auto sub_range : data | std::views::chunk_by(is_continuous)) {
std::cout << "子范围: ";
for (int num : sub_range) {
std::cout << num << " ";
}
std::cout << std::endl;
}
// 输出结果:
// 子范围: 1 2 3
// 子范围: 5 6
// 子范围: 8 9 10
// 子范围: 15
return 0;
}
场景2:按字符串前缀切分字符串序列
当处理字符串序列时,可以根据相邻字符串是否有相同的前缀来进行切分,比如按首字母分组。
#include <ranges>
#include <vector>
#include <string>
#include <iostream>
int main() {
std::vector<std::string> words = {"apple", "apricot", "banana", "berry", "cat", "camel"};
// 谓词:相邻字符串首字母相同则属于同一组
auto same_first_char = [](const std::string& a, const std::string& b) {
return a.empty() == false && b.empty() == false && a[0] == b[0];
};
for (auto sub_range : words | std::views::chunk_by(same_first_char)) {
std::cout << "分组: ";
for (const auto& word : sub_range) {
std::cout << word << " ";
}
std::cout << std::endl;
}
// 输出结果:
// 分组: apple apricot
// 分组: banana berry
// 分组: cat camel
return 0;
}
场景3:结合其他Range适配器使用
std::views::chunk_by可以和其他Range适配器组合使用,比如先过滤序列再切分,或者先切分再对每个子范围做处理。
#include <ranges>
#include <vector>
#include <iostream>
int main() {
std::vector<int> nums = {1, 3, 5, 2, 4, 6, 8, 10};
// 先过滤出偶数,再按连续性切分
auto even_continuous_chunks = nums
| std::views::filter([](int n) { return n % 2 == 0; })
| std::views::chunk_by([](int a, int b) { return b - a <= 2; });
for (auto sub_range : even_continuous_chunks) {
std::cout << "偶数连续组: ";
for (int num : sub_range) {
std::cout << num << " ";
}
std::cout << std::endl;
}
// 输出结果:
// 偶数连续组: 2 4
// 偶数连续组: 6 8 10
return 0;
}
与其他切分适配器的区别
C++标准库中还有std::views::chunk和std::views::split两个切分类适配器,和std::views::chunk_by的差异如下:
| 适配器名称 | 切分依据 | 切分粒度 | 适用场景 |
|---|---|---|---|
| std::views::chunk | 固定大小 | 每个子范围大小固定,最后一个可能更小 | 需要将序列等分成N个元素的子范围 |
| std::views::split | 指定的分隔元素/子序列 | 遇到分隔符就切分,分隔符不包含在结果中 | 按固定分隔符拆分序列,比如按逗号拆分字符串 |
| std::views::chunk_by | 相邻元素的谓词逻辑 | 子范围大小不固定,由谓词决定 | 按相邻元素的关系动态切分序列 |
注意事项
- std::views::chunk_by返回的是惰性求值的结果,不会立即生成所有子范围,只有在遍历的时候才会计算,适合处理大序列避免额外内存开销
- 如果谓词函数有副作用,比如修改外部变量,可能会导致未定义行为,建议谓词函数是纯函数
- 输入序列必须是至少支持前向迭代的Range,不支持输入迭代器的序列无法使用这个适配器
- 切分后的子范围是原序列的视图,修改子范围中的元素会直接修改原序列的元素,不需要额外拷贝
std::views::chunk_byC++Range谓词逻辑切分序列处理修改时间:2026-06-22 00:03:39