列表列表成numpy数组


Answers:


197

如果列表列表包含元素数量不同的列表,则Ignacio Vazquez-Abrams的答案将不起作用。相反,至少有3个选项:

1)制作一个数组数组:

x=[[1,2],[1,2,3],[1]]
y=numpy.array([numpy.array(xi) for xi in x])
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'numpy.ndarray'>

2)制作一个列表数组:

x=[[1,2],[1,2,3],[1]]
y=numpy.array(x)
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'list'>

3)首先使列表的长度相等:

x=[[1,2],[1,2,3],[1]]
length = max(map(len, x))
y=numpy.array([xi+[None]*(length-len(xi)) for xi in x])
y
>>>array([[1, 2, None],
>>>       [1, 2, 3],
>>>       [1, None, None]], dtype=object)

15
谢谢,来到这里。已经使用numpy了一段时间,并发现此行为不平凡。感谢您抽出宝贵的时间来解释这种更一般的情况。
亚当·休斯

dtype=float也可以使用,它将转换Nonenp.nan,这可能很有用。

104
>>> numpy.array([[1, 2], [3, 4]]) 
array([[1, 2], [3, 4]])

13
这会自动转换二维数组中的列表列表,因为所有包含的列表的长度都相同。您是否知道不这样做:即使所有列表的长度相同,也要创建一个列表数组?或者有可能在1D数组的1D数组中转换2D数组(有效的是,没有迭代方法或python map的东西)
Juh_ 2012年

7
如果由于您的子列表大小不均对您而言不起作用,请参见以下答案
Nikana Reklawyks

@NikanaReklawyks看完答案后我很困惑,但是您的评论很有帮助。我发现我的清单清单参差不齐,原本不应该这样。
Nikhil Girraj

38

由于这是Google上将列表列表转换为Numpy数组的热门搜索,尽管问题已经有4年之久,但我还是提供以下内容:

>>> x = [[1, 2], [1, 2, 3], [1]]
>>> y = numpy.hstack(x)
>>> print(y)
[1 2 1 2 3 1]

当我第一次想到以这种方式进行操作时,我对自己感到很满意,因为它非常简单。但是,在使用较大的列表列表进行计时之后,实际上这样做会更快:

>>> y = numpy.concatenate([numpy.array(i) for i in x])
>>> print(y)
[1 2 1 2 3 1]

请注意,@ Bastiaan的答案#1没有列出一个连续的列表,因此我添加了 concatenate

无论如何...我更喜欢这种hstack方法,因为它优雅地使用了Numpy。


12
尽管有些人可能正在寻找这个,但我敢肯定OP想要一个多维nparr。
弥敦道

1
我一直在寻找这个:))
Pallie


6

再一次,在搜索将具有N个级别的嵌套列表转换为N维数组的问题之后,我什么也没找到,所以这是我的解决方法:

import numpy as np

new_array=np.array([[[coord for coord in xk] for xk in xj] for xj in xi], ndmin=3) #this case for N=3

请注意,如果您已经具有嵌套列表结构,则不需要该[...[...[...]]]部分。你只需要调用np.array,用ndmin=number-of-list-layers。(尽管就我而言,ndmin=number-of-list-layers-minus-1出于某种原因我需要,但另外创建了一个额外的层-需要调查)
Venryx

好的,我的问题是,对于最深的“列表层”,列表的长度并不相同,这导致np.array只“包装”这些最深列表而不是将它们转换为numpy数组。
Venryx

-2

我有一个长度相等的清单。即使Ignacio Vazquez-Abrams那样,对我来说答案也没有解决。我有一个一维numpy数组,其元素是列表。如果遇到相同的问题,可以使用以下方法

numpy.vstack

import numpy as np

np_array = np.empty((0,4), dtype='float')
for i in range(10)
     row_data = ...   # get row_data as list
     np_array = np.vstack((np_array, np.array(row_data)))

如果知道知道有10个列表,为什么还要继续堆积呢?为什么不np.empty((10,4))然后填满呢?
Mehdi

-4

只是用熊猫

list(pd.DataFrame(listofstuff).melt().values)

这仅适用于列表列表

如果您有列表列表,则可能需要尝试以下方法

lists(pd.DataFrame(listofstuff).melt().apply(pd.Series).melt().values)
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.