程序设计 pandas

7

我有一个看起来像这样的Excel文档。 cluster load_date budget actual fixed_price A 1/1/2014 1000 4000 Y A 2/1/2014 12000 10000 Y A 3/1/2014 36000 2000 Y B 4/1/2014 15000 10000 N B 4/1/2014 12000 11500 N B 4/1/2014 90000 11000 N C 7/1/2014 22000 18000 N C 8/1/2014 30000 28960 N C 9/1/2014 53000 51200 …

287 python list pandas

4

将DataFrame列类型从字符串转换为日期时间，格式为dd / mm / yyyy

如何将字符串的DataFrame列（以dd / mm / yyyy格式）转换为日期时间？

283 python pandas dataframe datetime-format python-datetime

6

从Numpy数组创建Pandas DataFrame：如何指定索引列和列标题？

我有一个由列表列表组成的Numpy数组，代表带有行标签和列名的二维数组，如下所示： data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]]) 我希望所得的DataFrame将Row1和Row2作为索引值，并将Col1，Col2作为标头值我可以指定索引如下： df = pd.DataFrame(data,index=data[:,0]), 但是我不确定如何最好地分配列标题。

281 python pandas numpy

8

在熊猫中将两个系列组合到一个DataFrame中

我有两个Series，s1并且s2索引相同（非连续）。如何合并s1并s2成为DataFrame中的两列，并将其中一个索引保留为第三列？

278 python pandas series dataframe

8

如何选择除熊猫中的一列以外的所有列？

我有一个数据框看起来像这样： import pandas import numpy as np df = DataFrame(np.random.rand(4,4), columns = list('abcd')) df a b c d 0 0.418762 0.042369 0.869203 0.972314 1 0.991058 0.510228 0.594784 0.534366 2 0.407472 0.259811 0.396664 0.894202 3 0.726168 0.139531 0.324932 0.906575 我如何才能获得除以外的所有列column b？

278 python pandas

5

从字符串创建Pandas DataFrame

为了测试某些功能，我想DataFrame从字符串创建一个。假设我的测试数据如下： TESTDATA="""col1;col2;col3 1;4.4;99 2;4.5;200 3;4.7;65 4;3.2;140 """ 将数据读入熊猫的最简单方法是什么DataFrame？

276 python string pandas csv csv-import

11

如何在pandas groupby中将数据框行分组为列表？

我有一个熊猫数据框，df例如： a b A 1 A 2 B 5 B 5 B 4 C 6 我想按第一列分组并获得第二列作为行中的列表： A [1,2] B [5,5,4] C [6] 可以使用pandas groupby来做类似的事情吗？

274 python pandas list aggregate pandas-groupby

3

如何检查熊猫中是否存在列

有没有一种方法可以检查Pandas DataFrame中是否存在列？假设我有以下DataFrame： >>> import pandas as pd >>> from random import randint >>> df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) >>> df A B C 0 3 40 100 1 6 30 200 …

274 python pandas dataframe

6

Python Pandas：获取列匹配特定值的行的索引

给定一个带有“ BoolCol”列的DataFrame，我们要查找其中“ BoolCol” == True的值的DataFrame索引我目前有迭代的方式来做，很完美： for i in range(100,3000): if df.iloc[i]['BoolCol']== True: print i,df.iloc[i]['BoolCol'] 但这不是正确的熊猫方法。经过研究，我目前正在使用以下代码： df[df['BoolCol'] == True].index.tolist() 这给了我一份索引列表，但是当我通过以下方法检查它们时，它们不匹配： df.iloc[i]['BoolCol'] 结果实际上是错误的！哪一种是正确的Pandas方法？

274 python indexing pandas

21

熊猫轴是什么意思？

这是我的生成数据框的代码： import pandas as pd import numpy as np dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB')) 然后我得到了数据框： +------------+---------+--------+ | | A | B | +------------+---------+--------- | 0 | 0.626386| 1.52325| +------------+---------+--------+ 当我输入命令时： dff.mean(axis=1) 我有： 0 1.074821 dtype: float64 根据熊猫的参考，axis = 1代表列，我希望命令的结果是 A 0.626386 B 1.523255 dtype: float64 所以这是我的问题：大熊猫轴是什么意思？

269 python pandas numpy dataframe

10

如何在熊猫中获取数据框的列切片

我从CSV文件加载了一些机器学习数据。前两列是观测值，其余两列是要素。目前，我执行以下操作： data = pandas.read_csv('mydata.csv') 它给出了类似的东西： data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde')) 我想两个dataframes切片此数据框：包含列一个a和b和包含一个列c，d和e。不可能写这样的东西 observations = data[:'c'] features = data['c':] 我不确定最好的方法是什么。我需要一个pd.Panel吗？顺便说一下，我发现数据帧索引非常不一致：data['a']允许，但data[0]不允许。另一方面，data['a':]不允许，但允许data[0:]。是否有实际原因？如果列是由Int索引的，这确实令人困惑，因为data[0] != data[0:1]

264 python pandas numpy dataframe slice

8

如何将熊猫系列或索引转换为Numpy数组？

您是否知道如何以NumPy数组或python列表的形式获取DataFrame的索引或列？

264 python pandas

10

如何将空列添加到数据框？

向熊猫DataFrame对象添加空列的最简单方法是什么？我偶然发现的最好的东西是 df['foo'] = df.apply(lambda _: '', axis=1) 有没有那么不合常理的方法？

260 python pandas

6

如何将熊猫数据添加到现有的csv文件中？

我想知道是否可以使用pandas to_csv()函数将数据框添加到现有的csv文件中。csv文件与加载的数据具有相同的结构。

259 python pandas csv dataframe

11

如何从熊猫数据框中删除行列表？

我有一个数据框df： >>> df sales discount net_sales cogs STK_ID RPT_Date 600141 20060331 2.709 NaN 2.709 2.245 20060630 6.590 NaN 6.590 5.291 20060930 10.103 NaN 10.103 7.981 20061231 15.915 NaN 15.915 12.686 20070331 3.196 NaN 3.196 2.710 20070630 7.907 NaN 7.907 6.459 然后，我想删除具有列表中指示的某些序列号的行，假设此时留在这里[1,2,4],： sales discount net_sales cogs STK_ID RPT_Date 600141 20060331 2.709 …

257 python pandas

Questions tagged «pandas»