MySQL中的LENGTH()函数是用于获取字符串长度的内置函数,它的返回值是字符串占用的字节数,而非字符的实际个数,这一点是很多新手容易混淆的地方。不同的字符编码下,同一个字符占用的字节数不同,因此LENGTH()的计算结果也会存在差异。

LENGTH()函数的基本语法
LENGTH()函数的语法非常简单,只需要传入一个字符串参数即可,参数可以是字段名、字符串常量或者字符串表达式,函数会返回对应字符串的字节长度。
基本语法格式如下:
-- 计算字符串常量的长度
SELECT LENGTH('hello') AS str_length;
-- 计算表中字段的长度
SELECT username, LENGTH(username) AS name_length FROM user_table;
不同编码下的长度计算规则
字符编码是决定LENGTH()函数返回值的核心因素,常见的MySQL编码包括utf8、utf8mb4、latin1等,不同编码的单字符字节数不同:
- latin1编码:每个字符占用1个字节,此时LENGTH()的结果等于字符个数
- utf8编码:大部分常用汉字占用3个字节,英文字母、数字占用1个字节
- utf8mb4编码:支持emoji等特殊字符,这类特殊字符会占用4个字节,普通汉字占用3个字节,英文数字占用1个字节
我们可以通过下面的示例直观看到差异:
-- 假设当前数据库编码为utf8mb4
-- 纯英文字符串,每个字符1字节
SELECT LENGTH('test') AS len1; -- 结果为4
-- 包含汉字的字符串,每个汉字3字节,英文1字节
SELECT LENGTH('测试abc') AS len2; -- 结果为3*2 + 1*3 = 9
-- 包含emoji的字符串,emoji占4字节
SELECT LENGTH('😊你好') AS len3; -- 结果为4 + 3*2 = 10
与其他长度函数的对比
MySQL中还有CHAR_LENGTH()函数也用于获取字符串长度,二者的区别如下:
| 函数名 | 返回值含义 | 编码影响 |
|---|---|---|
| LENGTH() | 字符串占用的字节数 | 受编码影响,不同编码字节数不同 |
| CHAR_LENGTH() | 字符串的字符个数 | 不受编码影响,只统计字符数量 |
对比示例如下:
SELECT
LENGTH('中国') AS byte_length,
CHAR_LENGTH('中国') AS char_length;
-- utf8mb4编码下,byte_length结果为6,char_length结果为2
实际使用注意事项
在使用LENGTH()函数时,需要注意以下几点:
- 如果业务需要统计字符个数,优先使用
CHAR_LENGTH()函数,避免编码差异导致结果错误 - 如果要限制字段的存储字节大小,比如varchar字段的最大长度,可以用LENGTH()做校验
- 空字符串的长度为0,NULL值传入LENGTH()函数会返回NULL,使用时需要注意空值处理
以下是空值和NULL的处理示例:
SELECT
LENGTH('') AS empty_len, -- 结果为0
LENGTH(NULL) AS null_len; -- 结果为NULL
常见使用场景
LENGTH()函数在实际开发中有很多实用场景,比如:
- 校验用户昵称的字节长度,避免超出数据库字段的存储限制
- 统计文本内容的字节大小,用于计算存储占用
- 过滤掉长度为0的无效字符串数据
比如校验昵称字节长度的示例:
-- 查询昵称字节长度超过20的用户 SELECT user_id, nickname FROM user_info WHERE LENGTH(nickname) > 20;