Questions tagged «pandas»

Pandas是用于数据处理和分析的Python库,例如,在统计,实验科学结果,计量经济学或金融学中常见的数据框,多维时间序列和横截面数据集。Pandas是Python中主要的数据科学库之一。

5
将pandas数据框中的列从int转换为string
我在pandas中有一个数据帧,其中包含int和str数据列。我想先串联数据框内的列。为此,我必须将int列转换为str。我尝试做如下: mtrx['X.3'] = mtrx.to_string(columns = ['X.3']) 要么 mtrx['X.3'] = mtrx['X.3'].astype(str) 但是在两种情况下都无法正常工作,并且我收到一条错误消息:“无法连接'str'和'int'对象”。连接两str列效果很好。
106 python  string  pandas  dataframe  int 


2
熊猫中的for循环真的不好吗?我什么时候应该在意?
是for循环真正的“坏”?如果不是,在什么情况下它们会比使用更常规的“矢量化”方法更好?1个 我熟悉“矢量化”的概念,以及熊猫如何利用矢量化技术来加快计算速度。向量化功能在整个系列或DataFrame上广播操作,以实现比传统上迭代数据快得多的加速。 但是,我很惊讶地看到很多代码(包括来自Stack Overflow的答案)提供了解决问题的解决方案,这些问题涉及使用for循环和列表推导来遍历数据。文档和API指出循环是“不好的”循环,并且“绝不能”循环访问数组,序列或DataFrame。那么,为什么有时我会看到用户建议基于循环的解决方案? 1-虽然问题听起来似乎有些宽泛,但事实是,在某些非常特殊的情况下,for循环通常比传统上遍历数据更好。这篇文章的目的是为了后代。


6
像Qlik中那样在pandas数据框中的列中计算唯一值?
如果我有这样的表: df = pd.DataFrame({ 'hID': [101, 102, 103, 101, 102, 104, 105, 101], 'dID': [10, 11, 12, 10, 11, 10, 12, 10], 'uID': ['James', 'Henry', 'Abe', 'James', 'Henry', 'Brian', 'Claude', 'James'], 'mID': ['A', 'B', 'A', 'B', 'A', 'A', 'A', 'C'] }) 我可以count(distinct hID)在Qlik中提出5个唯一的hID。我该如何在Python中使用Pandas数据框?还是一个numpy数组?同样,如果这样做,count(hID)我将在Qlik中得到8。在大熊猫中做这件事的等效方法是什么?


6
如何合并两个数据帧?
我正在使用Pandas数据框。我说有一个初始数据框D。我从中提取两个数据帧,如下所示: A = D[D.label == k] B = D[D.label != k] 然后我更改标签中A和B A.label = 1 B.label = -1 我想将A和B结合起来,这样我就可以将它们作为一个数据帧使用,类似于联合操作。数据的顺序并不重要。但是,当我们从D采样A和B时,它们保留了D的索引。
105 python  pandas 

4
根据列表索引选择熊猫行
我有一个数据框df: 20060930 10.103 NaN 10.103 7.981 20061231 15.915 NaN 15.915 12.686 20070331 3.196 NaN 3.196 2.710 20070630 7.907 NaN 7.907 6.459 然后,我想选择列表中指示的具有某些序列号的行,假设这里是[1,3],然后向左移: 20061231 15.915 NaN 15.915 12.686 20070630 7.907 NaN 7.907 6.459 如何或什么功能可以做到这一点?
105 python  pandas 

6
Python Pandas将列表插入单元格
我有一个列表“ abc”和一个数据框“ df”: abc = ['foo', 'bar'] df = A B 0 12 NaN 1 23 NaN 我想将列表插入单元格1B中,所以我想要这个结果: A B 0 12 NaN 1 23 ['foo', 'bar'] 我能做到吗? 1)如果我使用这个: df.ix[1,'B'] = abc 我收到以下错误消息: ValueError: Must have equal len keys and value when setting with an iterable 因为它尝试将列表(具有两个元素)插入行/列而不插入单元格。 2)如果我使用这个: df.ix[1,'B'] = …



3
如何从Pandas DataFrame获取值而不是索引和对象类型
说我有以下DataFrame 字母编号 A 1 B 2 C 3 4天 可以通过以下代码获得 import pandas as pd letters=pd.Series(('A', 'B', 'C', 'D')) numbers=pd.Series((1, 2, 3, 4)) keys=('Letters', 'Numbers') df=pd.concat((letters, numbers), axis=1, keys=keys) 现在,我想从“字母”列中获取值C。 命令行 df[df.Letters=='C'].Letters 将返回 2℃ 名称:字母,dtype:对象 我怎样才能只获得C值而不是整个两行输出?
104 python  pandas  dataframe 

7
在Ipython notebook / Jupyter中,Pandas未显示我尝试绘制的图形
我正在尝试使用Ipython Notebook中的熊猫绘制一些数据,尽管它给了我对象,但实际上并没有绘制图形本身。所以看起来像这样: In [7]: pledge.Amount.plot() Out[7]: <matplotlib.axes.AxesSubplot at 0x9397c6c> 该图应在此之后,但根本不会出现。我已经导入了matplotlib,所以这不是问题。我还需要导入其他模块吗?

5
将列追加到熊猫数据框
这可能很容易,但是我有以下数据: 在数据框1中: index dat1 0 9 1 5 在数据框2中: index dat2 0 7 1 6 我想要一个具有以下形式的数据框: index dat1 dat2 0 9 7 1 5 6 我尝试使用该append方法,但是得到了交叉连接(即笛卡尔积)。 什么是正确的方法?
104 python  pandas 

7
如何删除熊猫数据框的最后一行数据
我认为这应该很简单,但是我尝试了一些想法,但都没有成功: last_row = len(DF) DF = DF.drop(DF.index[last_row]) #<-- fail! 我尝试使用负索引,但这也会导致错误。我仍然会误解一些基本知识。
104 python  pandas 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.