在数据库的实际使用中,经常会遇到需要截取字段里最后以特定字符隔开的内容的场景,比如存储的文件路径字段需要提取最后一级文件名,或者拼接的标签字段需要获取最后一个标签值。不同数据库系统的字符串处理函数存在差异,下面分别介绍主流数据库的实现方式。

MySQL实现方式
MySQL可以通过SUBSTRING_INDEX函数快速实现需求,该函数的作用是按照指定分隔符截取字符串,第二个参数可以指定截取的方向和次数。
语法格式:SUBSTRING_INDEX(str, delim, count),其中count为正数时从左边开始截取,为负数时从右边开始截取。
示例:截取字符串aaa_bbb_ccc中最后一个下划线之后的内容:
-- 原始字符串为 aaa_bbb_ccc,分隔符为下划线,count为-1表示从右边开始取第一个分隔符之后的内容
SELECT SUBSTRING_INDEX('aaa_bbb_ccc', '_', -1) AS result;
-- 输出结果为 ccc
SQL Server实现方式
SQL Server没有内置的直接截取最后分隔符后内容的函数,需要结合REVERSE、CHARINDEX、LEN等函数组合实现。
实现思路:先反转字符串,找到第一个分隔符的位置,再反转回来截取对应部分。
示例代码:
DECLARE @str VARCHAR(50) = 'aaa_bbb_ccc'; DECLARE @delim CHAR(1) = '_'; -- 反转字符串后找分隔符位置,计算需要截取的长度 SELECT RIGHT(@str, CHARINDEX(@delim, REVERSE(@str)) - 1) AS result; -- 输出结果为 ccc
Oracle实现方式
Oracle可以使用REGEXP_SUBSTR正则表达式函数实现,通过正则匹配最后一个分隔符之后的内容。
语法:REGEXP_SUBSTR(str, pattern, position, occurrence, match_param),这里使用正则[^_]+$匹配最后一个下划线之后的所有非下划线字符。
示例代码:
-- 匹配最后一个下划线之后的内容
SELECT REGEXP_SUBSTR('aaa_bbb_ccc', '[^_]+$') AS result FROM DUAL;
-- 输出结果为 ccc
PostgreSQL实现方式
PostgreSQL同样支持正则表达式截取,也可以使用SPLIT_PART函数实现,该函数可以按照分隔符分割字符串并返回指定位置的部分。
方法一:使用SPLIT_PART函数,需要知道分割后的总段数,可以通过STRING_TO_ARRAY获取数组长度。
-- 先转为数组,获取数组长度,再取最后一段
SELECT SPLIT_PART('aaa_bbb_ccc', '_', array_length(string_to_array('aaa_bbb_ccc', '_'), 1)) AS result;
-- 输出结果为 ccc
方法二:使用正则表达式函数SUBSTRING匹配:
SELECT SUBSTRING('aaa_bbb_ccc' FROM '[^_]+$') AS result;
-- 输出结果为 ccc
通用场景注意事项
- 如果字段中不存在指定的分隔符,上述方法在部分数据库中会返回原字符串,需要根据实际业务场景添加判断逻辑。
- 分隔符如果是多个字符的情况,需要调整函数的参数,比如MySQL的
SUBSTRING_INDEX支持多字符分隔符,正则匹配也需要对应调整正则规则。 - 处理大量数据时,正则匹配的性能通常低于内置字符串函数,优先选择数据库原生的非正则方法。