在SQL数据分析工作中,经常需要对不同分组的数据进行统计计算,中位数作为反映数据集中趋势的重要指标,其计算需求十分普遍。传统的分组聚合函数无法直接得到中位数,而PERCENTILE_CONT函数的出现很好地解决了这个问题。

PERCENTILE_CONT函数基本语法
PERCENTILE_CONT是SQL标准定义的窗口函数,用于计算指定百分位数的连续值,其中位数对应的百分位数为0.5。其基础语法结构如下:
PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER BY 排序字段) OVER (PARTITION BY 分组字段) AS 中位数别名
语法中各部分的含义:
- 0.5:表示要计算的百分位数,0.5对应中位数,0.25对应下四分位数,0.75对应上四分位数
- WITHIN GROUP (ORDER BY 排序字段):指定计算百分位数时的排序规则,必须显式声明
- OVER (PARTITION BY 分组字段):指定分组的维度,每个分组会独立计算对应的中位数
单分组字段的中位数计算示例
假设我们有一张销售数据表sales,包含以下字段:dept(部门)、salesperson(销售员)、amount(销售额)。现在需要计算每个部门的销售额中位数,示例数据如下:
| dept | salesperson | amount |
|---|---|---|
| 技术部 | 张三 | 12000 |
| 技术部 | 李四 | 15000 |
| 技术部 | 王五 | 18000 |
| 市场部 | 赵六 | 9000 |
| 市场部 | 钱七 | 11000 |
| 市场部 | 孙八 | 13000 |
| 市场部 | 周九 | 16000 |
计算各部门销售额中位数的SQL语句如下:
SELECT
dept,
salesperson,
amount,
-- 按部门分组计算销售额中位数
PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER BY amount) OVER (PARTITION BY dept) AS dept_median_amount
FROM sales;
执行上述语句后,技术部的中位数为15000,市场部的中位数为(11000+13000)/2=12000,对应每个部门的所有记录都会带上该部门的中位数结果。
多分组字段的中位数计算
如果需要同时按多个字段分组计算中位数,只需要在PARTITION BY子句中添加多个分组字段即可。比如现在需要同时按部门和销售季度分组计算销售额中位数,表结构增加quarter(季度)字段,SQL语句如下:
SELECT
dept,
quarter,
salesperson,
amount,
-- 按部门和季度双字段分组计算中位数
PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER BY amount) OVER (PARTITION BY dept, quarter) AS group_median_amount
FROM sales_detail;
不同数据库的使用注意事项
虽然PERCENTILE_CONT是SQL标准函数,但不同数据库的实现存在细微差异:
- MySQL 8.0及以上版本支持该函数,低版本无法使用
- PostgreSQL、Oracle、SQL Server均原生支持该函数,语法完全一致
- 如果分组内只有1条数据,中位数就是该条数据的对应字段值
- 如果分组内数据条数为偶数,函数会自动计算中间两个值的平均值作为中位数,无需额外处理
与传统方法的对比
在没有PERCENTILE_CONT函数的情况下,计算分组中位数通常需要先给数据排序编号,再判断奇偶取中间值,实现逻辑复杂且性能较差。使用PERCENTILE_CONT函数只需要一行代码即可完成,不仅逻辑更清晰,执行效率也更高,是分组中位数计算的最优方案。
注意:使用该函数时,OVER子句中的PARTITION BY和WITHIN GROUP中的ORDER BY是独立的两个排序逻辑,前者是分组逻辑,后者是计算百分位数的排序逻辑,不要混淆两者的作用。
SQLPERCENTILE_CONT分组数据中位数修改时间:2026-06-26 18:24:25