我有一个数字列表:
myList = [1, 2, 3, 100, 5]
现在,如果我对该列表进行排序以获得[1, 2, 3, 5, 100]
。我想要的是按排序顺序排列的原始列表中元素的索引,即[0, 1, 2, 4, 3]
--- ala MATLAB的sort函数,它既返回值又返回索引。
我有一个数字列表:
myList = [1, 2, 3, 100, 5]
现在,如果我对该列表进行排序以获得[1, 2, 3, 5, 100]
。我想要的是按排序顺序排列的原始列表中元素的索引,即[0, 1, 2, 4, 3]
--- ala MATLAB的sort函数,它既返回值又返回索引。
Answers:
如果使用的是numpy,则可以使用argsort()函数:
>>> import numpy
>>> numpy.argsort(myList)
array([0, 1, 2, 4, 3])
http://docs.scipy.org/doc/numpy/reference/generated/numpy.argsort.html
这将返回对数组或列表进行排序的参数。
如下所示:
>>> myList = [1, 2, 3, 100, 5]
>>> [i[0] for i in sorted(enumerate(myList), key=lambda x:x[1])]
[0, 1, 2, 4, 3]
enumerate(myList)
给您一个包含(索引,值)元组的列表:
[(0, 1), (1, 2), (2, 3), (3, 100), (4, 5)]
您可以通过将列表传递给sorted
并指定一个函数来提取排序键(每个元组的第二个元素;这就是它的lambda
目的)对列表进行排序。最后,使用[i[0] for i in ...]
列表推导来提取每个已排序元素的原始索引。
itemgetter(1)
,而不是lambda函数
sorted_items, sorted_inds = zip(*sorted([(i,e) for i,e in enumerate(my_list)], key=itemgetter(1)))
x = [3,1,2]; numpy.argsort(x)
产生[1,2,0]。
myList = [1, 2, 3, 100, 5]
sorted(range(len(myList)),key=myList.__getitem__)
[0, 1, 2, 4, 3]
使用enumerate
和更新了答案itemgetter
:
sorted(enumerate(a), key=lambda x: x[1])
# [(0, 1), (1, 2), (2, 3), (4, 5), (3, 100)]
将列表压缩在一起:元组中的第一个元素将是索引,第二个是值(然后使用元组的第二个值对其进行排序x[1]
,x是元组)
或者用itemgetter
从operator
module`:
from operator import itemgetter
sorted(enumerate(a), key=itemgetter(1))
我使用perfplot(我的一个项目)对这些进行了快速性能检查,发现很难推荐除numpy之外的其他任何东西(请注意对数刻度):
复制剧情的代码:
import perfplot
import numpy
def sorted_enumerate(seq):
return [i for (v, i) in sorted((v, i) for (i, v) in enumerate(seq))]
def sorted_enumerate_key(seq):
return [x for x, y in sorted(enumerate(seq), key=lambda x: x[1])]
def sorted_range(seq):
return sorted(range(len(seq)), key=seq.__getitem__)
def numpy_argsort(x):
return numpy.argsort(x)
perfplot.save(
"argsort.png",
setup=lambda n: numpy.random.rand(n),
kernels=[sorted_enumerate, sorted_enumerate_key, sorted_range, numpy_argsort],
n_range=[2 ** k for k in range(15)],
xlabel="len(x)",
)
本质上,您需要argsort
执行,所需的实现取决于您是要使用外部库(例如NumPy)还是要保持纯Python的依赖关系。
您需要问自己的问题是:您是否想要
不幸的是,问题中的示例并未明确说明所需的内容,因为两者都会给出相同的结果:
>>> arr = np.array([1, 2, 3, 100, 5])
>>> np.argsort(np.argsort(arr))
array([0, 1, 2, 4, 3], dtype=int64)
>>> np.argsort(arr)
array([0, 1, 2, 4, 3], dtype=int64)
argsort
实施如果您可以使用NumPy,则只需使用该函数numpy.argsort
或方法即可numpy.ndarray.argsort
。
已经在其他一些答案中提到了没有NumPy的实现,因此我将根据此处的基准答案来概述最快的解决方案
def argsort(l):
return sorted(range(len(l)), key=l.__getitem__)
要获取对数组/列表进行排序的索引,您只需调用argsort
数组或列表即可。我在这里使用的是NumPy版本,但是Python实现应该给出相同的结果
>>> arr = np.array([3, 1, 2, 4])
>>> np.argsort(arr)
array([1, 2, 0, 3], dtype=int64)
结果包含获取排序数组所需的索引。
由于排序数组将是[1, 2, 3, 4]
argsorted数组,因此包含原始元素中这些元素的索引。
1
,它1
在原始索引中为index ,因此结果的第一个元素为1
。2
at 2
是原始索引的索引,因此结果的第二个元素是2
。3
at 0
是原始索引的索引,因此结果的第三个元素是0
。4
,它3
在原始索引中,因此结果的最后一个元素是3
。在这种情况下,您需要申请argsort
两次:
>>> arr = np.array([3, 1, 2, 4])
>>> np.argsort(np.argsort(arr))
array([2, 0, 1, 3], dtype=int64)
在这种情况下 :
3
,这是第三个最大值,因此它将2
在排序后的数组/列表中具有索引,因此第一个元素是2
。1
,这是最小值,因此它将0
在排序后的数组/列表中具有索引,因此第二个元素是0
。2
,这是第二个最小的值,因此它将1
在排序后的数组/列表中具有索引,因此第三个元素是1
。4
是最大值,因此它将3
在排序后的数组/列表中具有索引,因此最后一个元素是3
。其他答案是错误的。
运行argsort
一次不是解决方案。例如,以下代码:
import numpy as np
x = [3,1,2]
np.argsort(x)
产量array([1, 2, 0], dtype=int64)
不是我们想要的。
答案应该是运行argsort
两次:
import numpy as np
x = [3,1,2]
np.argsort(np.argsort(x))
给出array([2, 0, 1], dtype=int64)
预期。
x[2]
(3)成为最小元素,而x[1]
(1)成为最大元素(因为对整数进行排序将它们从最小值到最大值排序)。同样,在OP的示例中,单个np.argsort([1, 2, 3, 100, 5])
yields array([0, 1, 2, 4, 3])
似乎是OP想要的索引。
arr = [1,2,3,100, 5, 9] res = np.argsort(arr) print(res)
那么我们会得出[0 1 2 4 5 3]
错误的信息。
arr[res]
yields array([ 1, 2, 3, 5, 9, 100])
,这似乎很好,因为结果数组的顺序是(递增)。
arr=[1,2,3,100, 5, 9]
,我希望输出是inds=[0,1,2,5,3,4]
,因为这是您将元素排序的顺序(越来越多)-1位于0位置,2位于第一位置,....,5位于第三名,第四名9。为了获得该输出(inds
),我需要运行argsort
两次,如前所述。
sort
的提及,我认为OP希望使用其他功能,就像np.argsort
通常使用的那样(可以使用该功能arr[np.argsort[arr]]
来获得排序的数组,如上一个MATLAB示例所示)。您的答案改为适用于这种情况/问题。
我们将创建另一个从0到n-1的索引数组,然后将其压缩到原始数组,然后根据原始值对其进行排序
ar = [1,2,3,4,5]
new_ar = list(zip(ar,[i for i in range(len(ar))]))
new_ar.sort()
`