如何从多维数组中提取列?


Answers:


227
>>> import numpy as np
>>> A = np.array([[1,2,3,4],[5,6,7,8]])

>>> A
array([[1, 2, 3, 4],
    [5, 6, 7, 8]])

>>> A[:,2] # returns the third columm
array([3, 7])

另请参阅:“ numpy.arange”和“ reshape”以分配内存

示例:(使用矩阵整形(3x4)分配数组)

nrows = 3
ncols = 4
my_array = numpy.arange(nrows*ncols, dtype='double')
my_array = my_array.reshape(nrows, ncols)

8
我花了2个小时才发现[:,2]猜猜此功能是否在切片方面没有官方文献?
niken

逗号是什么意思?
菲尔(Phil)

3
@Phil [row, col]。逗号分隔。
AsheKetchum

11
这个答案怎么会有这么多投票?OP从未说过它是一个numpy数组
sziraqui

3
对于提取2列:A [:,[1,3]]例如,提取第二和第四列
sadalsuud19年

176

可能是您正在使用NumPy数组吗?Python具有数组模块,但是不支持多维数组。普通的Python列表也是一维的。

但是,如果您有一个简单的二维列表,例如:

A = [[1,2,3,4],
     [5,6,7,8]]

然后您可以提取一个像这样的列:

def column(matrix, i):
    return [row[i] for row in matrix]

提取第二列(索引1):

>>> column(A, 1)
[2, 6]

或者,简单地:

>>> [row[1] for row in A]
[2, 6]

80

如果你有一个像

a = [[1, 2], [2, 3], [3, 4]]

然后像这样提取第一列:

[row[0] for row in a]

所以结果看起来像这样:

[1, 2, 3]

38

看看这个!

a = [[1, 2], [2, 3], [3, 4]]
a2 = zip(*a)
a2[0]

它与上面相同,只是它使zip工作更整洁,但需要单个数组作为参数,* a语法将多维数组解压缩为单个数组参数


7
以上是什么?请记住,答案并非总是以相同的方式排序。
Muhd

2
这很干净,但是如果考虑到性能,它可能不是最有效的,因为它会转置整个矩阵。
IceArdor 2014年

6
仅供参考,这在python 2中有效,但是在python 3中,您将获得生成器对象,这当然是不能下标的。
瑞沙·阿格哈里(Rishabh Agrahari)

@RishabhAgrahari无论如何要在Py3中压缩该拉链?
CtrlAltF2 '19

2
@WarpDriveEnterprises是的,您必须将生成器对象转换为list,然后进行下标。例如:a2 = zip(*a); a2 = list(a2); a2[0]
Rishabh Agrahari,

14
def get_col(arr, col):
    return map(lambda x : x[col], arr)

a = [[1,2,3,4], [5,6,7,8], [9,10,11,12],[13,14,15,16]]

print get_col(a, 3)

Python中的map函数是另一种方法。


11
>>> x = arange(20).reshape(4,5)
>>> x array([[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9],
        [10, 11, 12, 13, 14],
        [15, 16, 17, 18, 19]])

如果您想使用第二栏,可以使用

>>> x[:, 1]
array([ 1,  6, 11, 16])

1
这是使用numpy吗?
永远

1
arange()在numpy之外找不到Python3中的任何文档。任何人?
凯文·马修斯


9

如果您喜欢map-reduce样式的python,而不是列表推导,itemgetter运算符也可以提供帮助!

# tested in 2.4
from operator import itemgetter
def column(matrix,i):
    f = itemgetter(i)
    return map(f,matrix)

M = [range(x,x+5) for x in range(10)]
assert column(M,1) == range(1,11)

1
使用itertools.imap大数据
帕维尔Polewicz

对于我的用例,itemgetter方法的运行速度比列表理解方法快约50倍。Python 2.7.2,用例是在具有几百行和几列的矩阵上的大量迭代。
joelpt 2012年

7

您也可以使用此:

values = np.array([[1,2,3],[4,5,6]])
values[...,0] # first column
#[1,4]

注意:这不适用于内置数组且未对齐(例如np.array([[1,2,3],[4,5,6,7]]))


6

我想您想从数组(例如下面的数组)中提取列

import numpy as np
A = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])

现在,如果要获取格式的第三列

D=array[[3],
[7],
[11]]

然后,您需要首先使数组成为矩阵

B=np.asmatrix(A)
C=B[:,2]
D=asarray(C)

现在,您可以像在excel中一样进行元素明智的计算。


1
虽然这对我有很大帮助,但我认为答案可以短很多:1. A = np.array([[1,2,3,4],[5,6,7,8],[9,10, 11,12]])2. A [:, 1] >> array([
2,6,10

6

假设我们有n X m矩阵(n行和m列)说5行和4列

matrix = [[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16],[17,18,19,20]]

要提取python中的列,我们可以像这样使用列表理解

[ [row[i] for row in matrix] for in range(4) ]

您可以将矩阵中的列数替换为4。结果是

[ [1,5,9,13,17],[2,10,14,18],[3,7,11,15,19],[4,8,12,16,20] ]


这会创建一个全新的列表吗?
凯文·马修斯

5
array = [[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16]]

col1 = [val[1] for val in array]
col2 = [val[2] for val in array]
col3 = [val[3] for val in array]
col4 = [val[4] for val in array]
print(col1)
print(col2)
print(col3)
print(col4)

Output:
[1, 5, 9, 13]
[2, 6, 10, 14]
[3, 7, 11, 15]
[4, 8, 12, 16]

4

使用矩阵的另一种方法

>>> from numpy import matrix
>>> a = [ [1,2,3],[4,5,6],[7,8,9] ]
>>> matrix(a).transpose()[1].getA()[0]
array([2, 5, 8])
>>> matrix(a).transpose()[0].getA()[0]
array([1, 4, 7])

3

如果您在Python中有一个二维数组(不是numpy),则可以像这样提取所有列,

data = [
['a', 1, 2], 
['b', 3, 4], 
['c', 5, 6]
]

columns = list(zip(*data))

print("column[0] = {}".format(columns[0]))
print("column[1] = {}".format(columns[1]))
print("column[2] = {}".format(columns[2]))

执行此代码会产生

>>> print("column[0] = {}".format(columns[0]))
column[0] = ('a', 'b', 'c')

>>> print("column[1] = {}".format(columns[1]))
column[1] = (1, 3, 5)

>>> print("column[2] = {}".format(columns[2]))
column[2] = (2, 4, 6)

当然,您可以按索引提取单个列(例如columns[0]


2

尽管使用zip(*iterable)了转置嵌套列表,但是如果嵌套列表的长度不同,也可以使用以下内容:

map(None, *[(1,2,3,), (4,5,), (6,)])

结果是:

[(1, 4, 6), (2, 5, None), (3, None, None)]

因此,第一列是:

map(None, *[(1,2,3,), (4,5,), (6,)])[0]
#>(1, 4, 6)

2

好吧,有点晚...

如果性能很重要并且您的数据呈矩形,则也可以将其存储为一维,并通过常规切片访问列,例如...

A = [[1,2,3,4],[5,6,7,8]]     #< assume this 4x2-matrix
B = reduce( operator.add, A ) #< get it one-dimensional

def column1d( matrix, dimX, colIdx ):
  return matrix[colIdx::dimX]

def row1d( matrix, dimX, rowIdx ):
  return matrix[rowIdx:rowIdx+dimX] 

>>> column1d( B, 4, 1 )
[2, 6]
>>> row1d( B, 4, 1 )
[2, 3, 4, 5]

整洁的是,这真的很快。但是,负索引在这里不起作用!因此,您无法按索引-1访问最后一列或最后一行。

如果需要负索引,可以稍微调整访问器功能,例如

def column1d( matrix, dimX, colIdx ):
  return matrix[colIdx % dimX::dimX]

def row1d( matrix, dimX, dimY, rowIdx ):
  rowIdx = (rowIdx % dimY) * dimX
  return matrix[rowIdx:rowIdx+dimX]

我检查了这种方法,检索列的成本比嵌套循环便宜。但是,如果矩阵较大(例如1000 * 1000),则将2d矩阵缩减为1d的开销很大。
Zhongjun'Mark'Jin

2

如果要获取不止一列,请使用slice:

 a = np.array([[1, 2, 3],[4, 5, 6],[7, 8, 9]])
    print(a[:, [1, 2]])
[[2 3]
[5 6]
[8 9]]

2

我更喜欢下一条提示:将矩阵命名为matrix_ause column_number,例如:

import numpy as np
matrix_a = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
column_number=2

# you can get the row from transposed matrix - it will be a column:
col=matrix_a.transpose()[column_number]


0

矩阵中的所有列到新列表中:

N = len(matrix) 
column_list = [ [matrix[row][column] for row in range(N)] for column in range(N) ]
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.