Python生成器表达式和列表推导式内存占用差距有多大

来源：网络编程作者：阿里山老登头衔：草根站长

导读：本期聚焦于小伙伴创作的《Python生成器表达式和列表推导式内存占用差距有多大》，敬请观看详情，探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《Python生成器表达式和列表推导式内存占用差距有多大》有用，将其分享出去将是对创作者最好的鼓励。

Python中的生成器表达式和列表推导式语法相似，但二者的内存使用机制存在本质区别，实际开发中选择合适的语法能显著提升程序的内存利用率。

二者的核心差异

列表推导式的语法是[表达式 for 变量 in 可迭代对象]，它会在执行时一次性把所有计算结果生成并存储到列表中，占用对应的内存空间。

生成器表达式的语法是(表达式 for 变量 in 可迭代对象)，它不会立即生成数据，而是返回一个生成器对象，只有在迭代获取元素时才会逐个计算，属于惰性计算模式。

内存占用测试对比

我们通过sys.getsizeof方法来查看不同数据规模下两者的内存占用情况，首先测试小规模数据：

import sys

# 小规模数据测试，生成1到10的平方
list_comp = [i*i for i in range(1, 11)]
gen_exp = (i*i for i in range(1, 11))

print(f"列表推导式占用内存：{sys.getsizeof(list_comp)} 字节")
print(f"生成器表达式占用内存：{sys.getsizeof(gen_exp)} 字节")

运行上述代码，输出结果类似如下：

列表推导式占用内存：136 字节
生成器表达式占用内存：112 字节

可以看到小规模数据下，列表推导式因为需要存储10个整数元素，内存占用略高于生成器表达式。接下来测试大规模数据，生成1到1000000的平方：

import sys

# 大规模数据测试，生成1到1000000的平方
list_comp = [i*i for i in range(1, 1000001)]
gen_exp = (i*i for i in range(1, 1000001))

print(f"列表推导式占用内存：{sys.getsizeof(list_comp)} 字节")
print(f"生成器表达式占用内存：{sys.getsizeof(gen_exp)} 字节")

运行结果为：

列表推导式占用内存：8000064 字节
生成器表达式占用内存：112 字节

此时差距非常明显，列表推导式需要存储100万个整数，内存占用达到了8MB左右，而生成器表达式始终只占用生成器对象本身的内存，和数据规模无关。

适用场景分析

如果需要多次遍历生成的数据，或者需要对数据进行索引、切片等操作，适合使用列表推导式，因为生成器表达式只能单次迭代，也不支持索引操作。
如果只需要单次遍历数据，或者数据规模非常大，优先使用生成器表达式，避免一次性占用过多内存，尤其是在处理大文件、大数据流场景时优势明显。

注意事项

生成器表达式是惰性计算的，所以如果生成数据的逻辑中包含外部变量的修改，可能会出现不符合预期的结果，例如：

x = 10
gen = (i*x for i in range(3))
x = 20
# 迭代生成器时x已经是20，输出结果为0,20,40
for num in gen:
    print(num)

而列表推导式是在定义时就完成所有计算，不会受后续变量修改的影响，这一点在开发时需要根据实际需求判断。

Python 生成器表达式列表推导式内存占用修改时间：2026-06-19 21:51:23

免责声明：已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰，观点力求客观中立。本站旨在免费分享，内容仅供个人学习、研究或参考使用。若引用了第三方作品，版权归原作者所有。如内容涉及您的权益，请联系我们处理。