在MySQL的实际开发场景中,经常需要筛选出某个字段值以特定字符开头的记录,比如筛选用户名以“张”开头的所有用户,或者筛选订单编号以“ORD2024”开头的订单数据。这类查询需求可以通过多种语法实现,不同的实现方式在性能和适用场景上存在差异。

使用LIKE通配符实现开头匹配
LIKE是MySQL中最常用的模糊匹配操作符,配合通配符%可以实现以指定字符开头的查询。%代表任意长度的任意字符,当把它放在匹配规则的末尾时,就表示匹配以指定字符开头的内容。
语法格式如下:
-- 查询user表中username以"张"开头的所有记录 SELECT * FROM user WHERE username LIKE '张%'; -- 查询product表中product_code以"PHONE"开头的记录 SELECT * FROM product WHERE product_code LIKE 'PHONE%';
这种方式的优点是语法简单,容易理解,适合大多数简单的开头匹配场景。需要注意的是,如果字段值本身包含%字符,需要使用转义符处理,默认转义符是,也可以通过ESCAPE关键字自定义转义符。
使用正则表达式实现开头匹配
MySQL支持正则表达式匹配,通过REGEXP操作符可以实现更复杂的字符串匹配规则。要匹配以指定字符开头的内容,需要使用正则表达式的^元字符,它代表字符串的开头位置。
语法格式如下:
-- 查询user表中username以"张"开头的所有记录 SELECT * FROM user WHERE username REGEXP '^张'; -- 查询product表中product_code以"PHONE"或者"TABLE"开头的记录 SELECT * FROM product WHERE product_code REGEXP '^(PHONE|TABLE)';
正则表达式的优势在于可以处理更复杂的匹配规则,比如同时匹配多个开头字符、匹配开头字符后跟特定格式的内容等。但正则表达式的匹配性能通常比LIKE通配符稍差,尤其是在数据量较大的场景下。
两种方式的性能对比
我们可以通过简单的测试对比两种方式的性能差异,假设user表有10万条记录,username字段建立了普通索引:
| 查询方式 | 是否使用索引 | 平均查询耗时 |
|---|---|---|
| LIKE '张%' | 是 | 0.02秒 |
| REGEXP '^张' | 否 | 0.15秒 |
可以看到,当字段有索引时,LIKE '指定字符%'的写法可以使用索引,查询效率更高;而正则表达式匹配通常不会使用普通索引,全表扫描的情况下耗时更长。
实际场景选择建议
- 如果是简单的以单个或固定字符串开头的匹配,优先选择LIKE '指定字符%'的写法,性能更好。
- 如果需要匹配多个可能的开头字符,或者开头字符后需要符合特定格式,再选择正则表达式的方式。
- 如果查询的字段没有索引,且数据量较小,两种方式差异不大,可以根据开发习惯选择。
注意事项
在使用开头匹配查询时,需要注意字段的字符集和排序规则,不同的排序规则可能会影响匹配的结果,尤其是涉及中文字符时,建议使用utf8mb4字符集和对应的通用排序规则。另外,如果字段值可能为空,需要额外判断空值的情况,避免查询结果不符合预期。
-- 排除username为空的记录,同时匹配以"张"开头的内容 SELECT * FROM user WHERE username IS NOT NULL AND username LIKE '张%';