在NumPy的数据处理场景中,排序是高频操作,除了直接获取排序后的数组,很多时候我们还需要知道排序后元素对应的原始位置,或者按照二维数组中某一列的数值规则对整行进行排序,np.argsort()函数就是实现这些需求的核心工具。

np.argsort()函数基本用法
np.argsort()函数的作用是返回数组排序后的索引值,而不是直接返回排序后的数组。它的基本语法如下:
import numpy as np # 一维数组示例 arr = np.array([3, 1, 4, 2]) # 获取升序排序后的索引 sorted_indices = np.argsort(arr) print(sorted_indices) # 输出:[1 3 0 2] # 解释:原数组升序排序后是[1,2,3,4],对应原数组的索引分别是1、3、0、2
默认情况下,np.argsort()按照升序排序返回索引,如果需要降序排序,可以指定order参数或者取反操作:
import numpy as np arr = np.array([3, 1, 4, 2]) # 降序排序索引 desc_sorted_indices = np.argsort(-arr) print(desc_sorted_indices) # 输出:[2 0 3 1]
np.argsort()常用参数说明
np.argsort()的完整参数如下:
- a:待排序的数组,可以是任意维度的NumPy数组
- axis:指定排序的轴,默认是-1,即最后一个轴;对于二维数组,axis=0表示按列排序,axis=1表示按行排序
- kind:排序算法,可选值有quicksort(快速排序,默认)、mergesort(归并排序)、heapsort(堆排序)
- order:如果数组是结构化数组,可以指定按照哪个字段排序
按某列规则对二维数组行排序
在实际数据处理中,经常遇到二维数组,需要按照某一列的数值大小,对整行数据进行排序,这时候可以结合np.argsort()实现:
import numpy as np
# 创建二维数组,假设每一行是一条数据记录,第一列是id,第二列是分数
data = np.array([
[1, 85],
[2, 92],
[3, 78],
[4, 90]
])
# 按照第二列(分数)升序排序行
# 先获取第二列升序排序的索引
col_index = 1
sorted_row_indices = np.argsort(data[:, col_index])
# 按照索引取对应的行
sorted_data = data[sorted_row_indices]
print(sorted_data)
# 输出:
# [[ 3 78]
# [ 1 85]
# [ 4 90]
# [ 2 92]]
如果需要按照第二列降序排序行,只需要调整argsort的参数即可:
import numpy as np
data = np.array([
[1, 85],
[2, 92],
[3, 78],
[4, 90]
])
# 按照第二列降序排序行
col_index = 1
sorted_row_indices = np.argsort(-data[:, col_index])
sorted_data = data[sorted_row_indices]
print(sorted_data)
# 输出:
# [[ 2 92]
# [ 4 90]
# [ 1 85]
# [ 3 78]]
多列排序场景
如果需要先按照第一列排序,第一列相同的情况下再按照第二列排序,也可以使用np.argsort()结合元组实现:
import numpy as np
data = np.array([
[1, 85],
[2, 92],
[1, 90],
[2, 88]
])
# 先按第一列升序,再按第二列升序
# np.lexsort的排序优先级是从后往前,所以要反向传入列
sorted_indices = np.lexsort((data[:, 1], data[:, 0]))
sorted_data = data[sorted_indices]
print(sorted_data)
# 输出:
# [[ 1 85]
# [ 1 90]
# [ 2 88]
# [ 2 92]]
注意事项
使用np.argsort()时需要注意,返回的索引数组的数据类型是整型,直接作为索引取值时不会报错,但如果索引数组包含超出原数组范围的值,就会触发索引错误。另外,对于高维数组,指定axis参数时要明确对应的轴含义,避免排序结果不符合预期。
NumPynp_argsort排序索引按列排序数组排序修改时间:2026-06-21 00:33:25