Questions tagged «pandas»

Pandas是用于数据处理和分析的Python库,例如,在统计,实验科学结果,计量经济学或金融学中常见的数据框,多维时间序列和横截面数据集。Pandas是Python中主要的数据科学库之一。

7
从熊猫数据框列获取列表
我有一个看起来像这样的Excel文档。 cluster load_date budget actual fixed_price A 1/1/2014 1000 4000 Y A 2/1/2014 12000 10000 Y A 3/1/2014 36000 2000 Y B 4/1/2014 15000 10000 N B 4/1/2014 12000 11500 N B 4/1/2014 90000 11000 N C 7/1/2014 22000 18000 N C 8/1/2014 30000 28960 N C 9/1/2014 53000 51200 …
287 python  list  pandas 


6
从Numpy数组创建Pandas DataFrame:如何指定索引列和列标题?
我有一个由列表列表组成的Numpy数组,代表带有行标签和列名的二维数组,如下所示: data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]]) 我希望所得的DataFrame将Row1和Row2作为索引值,并将Col1,Col2作为标头值 我可以指定索引如下: df = pd.DataFrame(data,index=data[:,0]), 但是我不确定如何最好地分配列标题。
281 python  pandas  numpy 


8
如何选择除熊猫中的一列以外的所有列?
我有一个数据框看起来像这样: import pandas import numpy as np df = DataFrame(np.random.rand(4,4), columns = list('abcd')) df a b c d 0 0.418762 0.042369 0.869203 0.972314 1 0.991058 0.510228 0.594784 0.534366 2 0.407472 0.259811 0.396664 0.894202 3 0.726168 0.139531 0.324932 0.906575 我如何才能获得除以外的所有列column b?
278 python  pandas 



3
如何检查熊猫中是否存在列
有没有一种方法可以检查Pandas DataFrame中是否存在列? 假设我有以下DataFrame: >>> import pandas as pd >>> from random import randint >>> df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) >>> df A B C 0 3 40 100 1 6 30 200 …
274 python  pandas  dataframe 

6
Python Pandas:获取列匹配特定值的行的索引
给定一个带有“ BoolCol”列的DataFrame,我们要查找其中“ BoolCol” == True的值的DataFrame索引 我目前有迭代的方式来做,很完美: for i in range(100,3000): if df.iloc[i]['BoolCol']== True: print i,df.iloc[i]['BoolCol'] 但这不是正确的熊猫方法。经过研究,我目前正在使用以下代码: df[df['BoolCol'] == True].index.tolist() 这给了我一份索引列表,但是当我通过以下方法检查它们时,它们不匹配: df.iloc[i]['BoolCol'] 结果实际上是错误的! 哪一种是正确的Pandas方法?
274 python  indexing  pandas 

21
熊猫轴是什么意思?
这是我的生成数据框的代码: import pandas as pd import numpy as np dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB')) 然后我得到了数据框: +------------+---------+--------+ | | A | B | +------------+---------+--------- | 0 | 0.626386| 1.52325| +------------+---------+--------+ 当我输入命令时: dff.mean(axis=1) 我有 : 0 1.074821 dtype: float64 根据熊猫的参考,axis = 1代表列,我希望命令的结果是 A 0.626386 B 1.523255 dtype: float64 所以这是我的问题:大熊猫轴是什么意思?

10
如何在熊猫中获取数据框的列切片
我从CSV文件加载了一些机器学习数据。前两列是观测值,其余两列是要素。 目前,我执行以下操作: data = pandas.read_csv('mydata.csv') 它给出了类似的东西: data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde')) 我想两个dataframes切片此数据框:包含列一个a和b和包含一个列c,d和e。 不可能写这样的东西 observations = data[:'c'] features = data['c':] 我不确定最好的方法是什么。我需要一个pd.Panel吗? 顺便说一下,我发现数据帧索引非常不一致:data['a']允许,但data[0]不允许。另一方面,data['a':]不允许,但允许data[0:]。是否有实际原因?如果列是由Int索引的,这确实令人困惑,因为data[0] != data[0:1]


10
如何将空列添加到数据框?
向熊猫DataFrame对象添加空列的最简单方法是什么?我偶然发现的最好的东西是 df['foo'] = df.apply(lambda _: '', axis=1) 有没有那么不合常理的方法?
260 python  pandas 


11
如何从熊猫数据框中删除行列表?
我有一个数据框df: >>> df sales discount net_sales cogs STK_ID RPT_Date 600141 20060331 2.709 NaN 2.709 2.245 20060630 6.590 NaN 6.590 5.291 20060930 10.103 NaN 10.103 7.981 20061231 15.915 NaN 15.915 12.686 20070331 3.196 NaN 3.196 2.710 20070630 7.907 NaN 7.907 6.459 然后,我想删除具有列表中指示的某些序列号的行,假设此时留在这里[1,2,4],: sales discount net_sales cogs STK_ID RPT_Date 600141 20060331 2.709 …
257 python  pandas 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.