NumPy数据类型怎么改_astype()强转为float32或int64减小内存消耗

来源：苹果APP网作者：宋琮安头衔：草根站长

导读：本期聚焦于小伙伴创作的《NumPy数据类型怎么改_astype()强转为float32或int64减小内存消耗》，敬请观看详情，探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《NumPy数据类型怎么改_astype()强转为float32或int64减小内存消耗》有用，将其分享出去将是对创作者最好的鼓励。

在NumPy的实际使用中，数组的默认数据类型通常会占用较多内存，比如默认的浮点类型是float64，整数类型默认是int64，当处理百万级甚至千万级的大规模数据时，这些默认类型会大幅占用内存空间，甚至可能导致内存溢出。通过astype()方法可以灵活修改数组的数据类型，将数组转换为占用内存更小的类型，比如float32、int32等，在保证计算需求的前提下有效降低内存消耗。

NumPy数据类型基础

NumPy支持多种基础数据类型，不同数据类型的占用内存空间和数值范围存在差异，常见的数据类型如下：

整数类型：int8、int16、int32、int64，分别对应1、2、4、8字节的内存占用，数值范围随位数增加而扩大
浮点类型：float16、float32、float64，分别对应2、4、8字节的内存占用，精度随位数增加而提升
布尔类型：bool，占用1字节内存，仅存储True和False两种值

我们可以通过数组的dtype属性查看当前数组的数据类型，示例代码如下：

import numpy as np

# 创建默认整数数组
arr_int = np.array([1, 2, 3, 4, 5])
print("默认整数数组类型:", arr_int.dtype)  # 输出 int64

# 创建默认浮点数组
arr_float = np.array([1.0, 2.0, 3.0])
print("默认浮点数组类型:", arr_float.dtype)  # 输出 float64

astype()方法的基本用法

astype()是NumPy数组对象的内置方法，用于返回一个新的数组，新数组的数据类型由传入的参数指定，原数组的数据类型不会被修改。方法的基本语法为：

新数组 = 原数组.astype(目标数据类型)

目标数据类型可以直接传入NumPy的数据类型对象，比如np.float32、np.int64，也可以传入数据类型的字符串表示，比如'float32'、'int64'。

转换为float32减小内存消耗

默认的浮点数组类型是float64，占用8字节内存，如果计算场景不需要双精度浮点，转换为float32可以节省一半的内存空间，示例代码如下：

import numpy as np

# 创建默认float64数组
arr_float64 = np.random.rand(1000000)  # 100万个随机浮点数
print("转换前类型:", arr_float64.dtype)  # 输出 float64
print("转换前单个元素内存:", arr_float64.itemsize, "字节")  # 输出 8 字节

# 转换为float32
arr_float32 = arr_float64.astype(np.float32)
print("转换后类型:", arr_float32.dtype)  # 输出 float32
print("转换后单个元素内存:", arr_float32.itemsize, "字节")  # 输出 4 字节

# 计算总内存占用差异
print("转换前总内存:", arr_float64.nbytes, "字节")  # 8000000 字节
print("转换后总内存:", arr_float32.nbytes, "字节")  # 4000000 字节

转换为int64的场景说明

如果原数组是整数类型且位数较低，比如int32，当数值范围超过int32的上限（-2147483648到2147483647）时，需要转换为int64避免数值溢出，示例代码如下：

import numpy as np

# 创建int32数组，包含超过int32上限的数值
arr_int32 = np.array([2147483648, 2147483649], dtype=np.int32)
# 注意：直接创建会溢出，这里先以int64创建再转换展示效果
arr_int64 = np.array([2147483648, 2147483649], dtype=np.int64)
print("int64数组数值:", arr_int64)  # 输出 [2147483648 2147483649]
print("int64数组类型:", arr_int64.dtype)  # 输出 int64

# 如果需要从低位数整数转int64
arr_low = np.array([1, 2, 3], dtype=np.int32)
arr_to_int64 = arr_low.astype(np.int64)
print("转换后类型:", arr_to_int64.dtype)  # 输出 int64

astype()使用注意事项

astype()返回的是新数组，原数组不会被修改，如果需要覆盖原数组需要重新赋值
数据类型转换可能会导致精度损失，比如float64转float32会丢失部分小数位，整数转浮点会丢失整数部分以外的精度
转换时需要确保目标数据类型能够容纳原数组的所有数值，否则会出现数值溢出或异常
布尔类型转换为整数时，True会转为1，False会转为0；整数转换为布尔类型时，非0值转为True，0转为False

以下是精度损失的示例：

import numpy as np

arr = np.array([1.123456789], dtype=np.float64)
print("原数值:", arr[0])  # 输出 1.123456789

arr_float32 = arr.astype(np.float32)
print("转换后数值:", arr_float32[0])  # 输出 1.1234568，出现精度损失

实际场景应用示例

假设我们需要处理一个包含1000万个样本的特征数据集，每个样本有10个特征，默认使用float64类型存储，总内存占用为：

10000000 * 10 * 8字节 = 800000000字节 ≈ 763MB

如果转换为float32类型，总内存占用会降为约381MB，大幅降低内存压力，代码示例如下：

import numpy as np

# 模拟1000万样本，10个特征的数据集
data = np.random.rand(10000000, 10)
print("原始数据内存占用:", data.nbytes / 1024 / 1024, "MB")  # 约 762.94 MB

# 转换为float32
data_optimized = data.astype(np.float32)
print("优化后数据内存占用:", data_optimized.nbytes / 1024 / 1024, "MB")  # 约 381.47 MB

通过合理选择数据类型并使用astype()进行转换，可以在不显著影响计算效果的前提下，大幅优化NumPy数组的内存使用效率，尤其适合大规模数据处理的场景。

NumPy astype()float32 int64 数据类型转换修改时间：2026-06-11 04:36:26

免责声明：已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰，观点力求客观中立。本站旨在免费分享，内容仅供个人学习、研究或参考使用。若引用了第三方作品，版权归原作者所有。如内容涉及您的权益，请联系我们处理。