在Pandas DataFrame对象中重新定义索引


84

我正在尝试重新索引熊猫DataFrame对象,像这样,

From:
            a   b   c
        0   1   2   3
        1  10  11  12
        2  20  21  22

To :
           b   c
       1   2   3
      10  11  12
      20  21  22

我正在如下所示进行操作,并且得到了错误的答案。有关如何执行此操作的任何线索?

>>> col = ['a','b','c']
>>> data = DataFrame([[1,2,3],[10,11,12],[20,21,22]],columns=col)
>>> data
    a   b   c
0   1   2   3
1  10  11  12
2  20  21  22
>>> idx2 = data.a.values
>>> idx2
array([ 1, 10, 20], dtype=int64)
>>> data2 = DataFrame(data,index=idx2,columns=col[1:])
>>> data2
     b   c
1   11  12
10 NaN NaN
20 NaN NaN

知道为什么会这样吗?


1
因为您正在使用第一个DF构建第二个DF,所以只会获取idx2与data.index相交的行。第1列
RuiDC 2012年

Answers:


188

为什么不简单地使用set_index方法?

In : col = ['a','b','c']

In : data = DataFrame([[1,2,3],[10,11,12],[20,21,22]],columns=col)

In : data
Out:
    a   b   c
0   1   2   3
1  10  11  12
2  20  21  22

In : data2 = data.set_index('a')

In : data2
Out:
     b   c
a
1    2   3
10  11  12
20  21  22

17
为了删除索引名称,如原始示例中所示:data2.index.name = None
Daniele

5

如果您不想在索引中使用“ a”

在:

col = ['a','b','c']

data = DataFrame([[1,2,3],[10,11,12],[20,21,22]],columns=col)

data

出:

    a   b   c
0   1   2   3
1  10  11  12
2  20  21  22

在:

data2 = data.set_index('a')

出:

     b   c
a
1    2   3
10  11  12
20  21  22

在:

data2.index.name = None

出:

     b   c
 1   2   3
10  11  12
20  21  22

1
第二个输出不正确。左侧仍然有一个未命名的列,其中包含
0、1、2。– Yster
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.