Questions tagged «dataframe»

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框”或“数据框”是几种语言用于此概念的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),但“表”是MATLAB和SQL。


22
如何在Pandas的DataFrame中的行上进行迭代?
我有一个DataFrame熊猫来的: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print df 输出: c1 c2 0 10 100 1 11 110 2 12 120 现在,我要遍历该框架的行。对于每一行,我希望能够通过列名访问其元素(单元格中的值)。例如: for row in df.rows: print row['c1'], row['c2'] 熊猫有可能这样做吗? 我发现了类似的问题。但这并不能给我我所需的答案。例如,建议在那里使用: for date, row in df.T.iteritems(): 要么 for row in df.iterrows(): 但我不了解该row对象是什么以及如何使用它。
1943 python  pandas  rows  dataframe 

26
重命名熊猫列
我有一个使用熊猫和列标签的DataFrame,我需要对其进行编辑以替换原始列标签。 我想A在原始列名称为的DataFrame 中更改列名称: ['$a', '$b', '$c', '$d', '$e'] 至 ['a', 'b', 'c', 'd', 'e']. 我已经将编辑后的列名存储在列表中,但是我不知道如何替换列名。

15
从pandas DataFrame删除列
在删除DataFrame中的列时,我使用: del df['column_name'] 这很棒。为什么不能使用以下内容? del df.column_name 由于可以按来访问列/系列df.column_name,因此我希望它能正常工作。
1321 python  pandas  dataframe 

19
如何按多个列对数据框进行排序
我想按多个列对data.frame进行排序。例如,对于下面的data.frame,我想按列z(降序)然后按列b(升序)排序: dd <- data.frame(b = factor(c("Hi", "Med", "Hi", "Low"), levels = c("Low", "Med", "Hi"), ordered = TRUE), x = c("A", "D", "A", "C"), y = c(8, 3, 9, 9), z = c(1, 1, 1, 2)) dd b x y z 1 Hi A 8 1 2 Med D 3 1 …
1316 r  sorting  dataframe  r-faq 


17
在pandas数据框中选择多个列
我在不同的列中有数据,但是我不知道如何提取数据以将其保存在另一个变量中。 index a b c 1 2 3 4 2 3 4 5 如何选择'a','b'并将其保存到df1? 我试过了 df1 = df['a':'b'] df1 = df.ix[:, 'a':'b'] 似乎没有任何工作。
1108 python  pandas  dataframe  select 

19
从pandas DataFrame列标题获取列表
我想从pandas DataFrame获取列标题的列表。DataFrame来自用户输入,所以我不知道会有多少列或它们将被称为什么。 例如,如果给我这样的数据框: >>> my_dataframe y gdp cap 0 1 2 5 1 2 3 9 2 8 7 2 3 3 4 7 4 6 7 7 5 4 8 3 6 8 2 8 7 9 9 10 8 6 6 4 9 10 10 7 我想要一个这样的列表: >>> …
1013 python  pandas  dataframe 

23
在Python Pandas中向现有DataFrame添加新列
我有以下索引的DataFrame,其中的命名列和行不是连续数字: a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758 0.075793 -0.451460 -0.012493 我想'e'在现有数据框架中添加一个新列,并且不想更改数据框架中的任何内容(即,新列始终与DataFrame具有相同的长度)。 0 -0.335485 1 -1.166658 2 -0.385571 dtype: float64 如何e在上述示例中添加列?

14
如何获取大熊猫DataFrame的行数?
我正在尝试使用Pandas获取数据框df的行数,这是我的代码。 方法1: total_rows = df.count print total_rows +1 方法2: total_rows = df['First_columnn_label'].count print total_rows +1 这两个代码段都给我这个错误: TypeError:+不支持的操作数类型:“ instancemethod”和“ int” 我究竟做错了什么?
929 python  pandas  dataframe 

30
如何更改DataFrame列的顺序?
我有以下DataFrame(df): import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand(10, 5)) 我通过分配添加了更多列: df['mean'] = df.mean(1) 如何将列mean移到最前面,即将其设置为第一列,而其他列的顺序保持不变?
875 python  pandas  dataframe 

20
按名称删除数据框列
我想从数据框中删除许多列。我知道我们可以使用类似的方法分别删除它们: df$x <- NULL 但是我希望用更少的命令来做到这一点。 另外,我知道我可以使用整数索引删除列,如下所示: df <- df[ -c(1, 3:6, 12) ] 但是我担心我的变量的相对位置可能会改变。 考虑到R的强大功能,我认为可能有比逐一删除每一列更好的方法。
874 r  dataframe  r-faq 

25
向pandas DataFrame添加一行
我知道pandas旨在加载完全填充的内容,DataFrame但是我需要创建一个空的DataFrame然后逐行添加行。做这个的最好方式是什么 ? 我成功创建了一个空的DataFrame: res = DataFrame(columns=('lib', 'qty1', 'qty2')) 然后,我可以添加新行,并使用以下字段填充字段: res = res.set_value(len(res), 'qty1', 10.0) 它有效,但看起来很奇怪:-/(添加字符串值失败) 如何将新行添加到DataFrame(具有不同的列类型)?


9
更改Pandas中列的数据类型
我想将表示为列表列表的表转换为Pandas DataFrame。作为一个极其简化的示例: a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']] df = pd.DataFrame(a) 将列转换为适当类型的最佳方法是什么,在这种情况下,将列2和3转换为浮点数?有没有一种方法可以在转换为DataFrame时指定类型?还是先创建DataFrame然后遍历各列以更改各列的类型更好?理想情况下,我想以动态方式执行此操作,因为可以有数百个列,并且我不想确切指定哪些列属于哪种类型。我可以保证的是,每一列都包含相同类型的值。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.