在实际的数据库开发场景中,为了减少表关联或者快速存储简单多值数据,经常会把多个值用逗号拼接后存到单个MySQL字段里,比如用户标签、商品分类等字段。当需要根据单个值做筛选或者提取特定位置的值时,就需要掌握对应的提取方法。

使用SUBSTRING_INDEX函数提取
SUBSTRING_INDEX是MySQL内置的字符串截取函数,专门用于处理分隔符分割的字符串,语法为SUBSTRING_INDEX(str,delim,count),其中str是要处理的字符串,delim是分隔符,count是截取次数。当count为正数时,从左边开始截取第count个分隔符左边的所有内容;当count为负数时,从右边开始截取第abs(count)个分隔符右边的所有内容。
如果要提取第一个逗号前的值,可以使用如下SQL:
-- 假设表名为user_tags,字段tag_list存储逗号分隔的标签,提取第一个标签
SELECT
id,
tag_list,
SUBSTRING_INDEX(tag_list, ',', 1) AS first_tag
FROM user_tags;
如果要提取第二个逗号前的值,也就是前两个标签,count设置为2即可:
-- 提取前两个标签
SELECT
id,
tag_list,
SUBSTRING_INDEX(tag_list, ',', 2) AS first_two_tags
FROM user_tags;
如果需要提取最后一个标签,count设置为-1:
-- 提取最后一个标签
SELECT
id,
tag_list,
SUBSTRING_INDEX(tag_list, ',', -1) AS last_tag
FROM user_tags;
提取指定位置的单个值
SUBSTRING_INDEX只能截取某个分隔符之前或之后的所有内容,如果需要提取第N个逗号分隔的单个值,可以结合两次SUBSTRING_INDEX使用。比如要提取第二个标签,先截取前两个标签,再从结果里截取最后一个标签:
-- 提取第二个标签
SELECT
id,
tag_list,
SUBSTRING_INDEX(SUBSTRING_INDEX(tag_list, ',', 2), ',', -1) AS second_tag
FROM user_tags;
这个逻辑的原理是,内层SUBSTRING_INDEX(tag_list, ',', 2)得到前两个标签拼接的字符串,外层再用SUBSTRING_INDEX取这个字符串最后一个逗号右边的内容,也就是第二个标签。
根据值是否存在做筛选
如果需要查询tag_list中包含某个特定标签的记录,不能直接用等于判断,因为字段是拼接的字符串。可以使用FIND_IN_SET函数,语法为FIND_IN_SET(str,strlist),返回str在strlist中的位置,不存在则返回0。
-- 查询包含标签"php"的记录
SELECT *
FROM user_tags
WHERE FIND_IN_SET('php', tag_list) > 0;
注意FIND_IN_SET的strlist参数必须是逗号分隔的字符串,且不能有空格,如果字段里的逗号后有空格,需要先处理空格再使用:
-- 处理逗号后的空格后查询
SELECT *
FROM user_tags
WHERE FIND_IN_SET('php', REPLACE(tag_list, ' ', '')) > 0;
复杂场景的自定义函数方案
如果需要频繁提取第N个逗号分隔的值,可以创建自定义函数来简化操作。以下是创建获取第N个值的函数示例:
-- 创建获取第N个逗号分隔值的函数,n从1开始
DELIMITER //
CREATE FUNCTION get_split_value(str VARCHAR(255), n INT)
RETURNS VARCHAR(255)
BEGIN
DECLARE result VARCHAR(255);
SET result = REPLACE(SUBSTRING_INDEX(SUBSTRING_INDEX(str, ',', n), ',', -1), ' ', '');
RETURN result;
END //
DELIMITER ;
创建完成后就可以直接调用函数提取:
-- 调用自定义函数提取第三个标签
SELECT
id,
tag_list,
get_split_value(tag_list, 3) AS third_tag
FROM user_tags;
注意事项
- 逗号分隔存储的方式不符合第一范式,数据更新和查询效率都比较低,建议优先使用关联表存储多值数据。
- 使用SUBSTRING_INDEX时如果字段里没有对应数量的分隔符,会返回整个字段内容,需要提前判断数据格式。
- FIND_IN_SET函数不会使用索引,大数据量查询时性能较差,需要谨慎使用。
MySQL逗号分隔值字符串函数SUBSTRING_INDEXSQL查询修改时间:2026-06-21 04:12:31