Questions tagged «dataframe»

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框”或“数据框”是几种语言用于此概念的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),但“表”是MATLAB和SQL。

8
逐行创建R数据帧
我想在R中逐行构造一个数据帧。我已经做了一些搜索,而我的建议是创建一个空列表,保持列表索引标量,然后每次添加到列表中一个单行数据帧,并将列表索引前移一个。最后,do.call(rbind,)在列表上。 尽管此方法有效,但似乎非常麻烦。有没有更简单的方法可以实现相同的目标? 显然,我指的是无法使用某些apply功能并且明确需要逐行创建数据框的情况。至少,有一种方法可以push进入列表的末尾,而不是显式跟踪最后使用的索引吗?
107 list  r  dataframe 


5
将pandas数据框中的列从int转换为string
我在pandas中有一个数据帧,其中包含int和str数据列。我想先串联数据框内的列。为此,我必须将int列转换为str。我尝试做如下: mtrx['X.3'] = mtrx.to_string(columns = ['X.3']) 要么 mtrx['X.3'] = mtrx['X.3'].astype(str) 但是在两种情况下都无法正常工作,并且我收到一条错误消息:“无法连接'str'和'int'对象”。连接两str列效果很好。
106 python  string  pandas  dataframe  int 



6
Python Pandas将列表插入单元格
我有一个列表“ abc”和一个数据框“ df”: abc = ['foo', 'bar'] df = A B 0 12 NaN 1 23 NaN 我想将列表插入单元格1B中,所以我想要这个结果: A B 0 12 NaN 1 23 ['foo', 'bar'] 我能做到吗? 1)如果我使用这个: df.ix[1,'B'] = abc 我收到以下错误消息: ValueError: Must have equal len keys and value when setting with an iterable 因为它尝试将列表(具有两个元素)插入行/列而不插入单元格。 2)如果我使用这个: df.ix[1,'B'] = …


3
如何从Pandas DataFrame获取值而不是索引和对象类型
说我有以下DataFrame 字母编号 A 1 B 2 C 3 4天 可以通过以下代码获得 import pandas as pd letters=pd.Series(('A', 'B', 'C', 'D')) numbers=pd.Series((1, 2, 3, 4)) keys=('Letters', 'Numbers') df=pd.concat((letters, numbers), axis=1, keys=keys) 现在,我想从“字母”列中获取值C。 命令行 df[df.Letters=='C'].Letters 将返回 2℃ 名称:字母,dtype:对象 我怎样才能只获得C值而不是整个两行输出?
104 python  pandas  dataframe 


5
如何从R data.frame获取行
我有一个带列标题的data.frame。 如何从data.frame中获得特定行作为列表(以列标题作为列表的键)? 具体来说,我的data.frame是 美国广播公司 1 5 4.25 4.5 2 3.5 4 2.5 3 3.25 4 4 4 4.25 4.5 2.25 5 1.5 4.5 3 我想得到的行相当于 > c(a=5, b=4.25, c=4.5) a b c 5.0 4.25 4.5
103 r  indexing  dataframe 

13
如何计算一列字符串的每一行中给定字符的出现次数?
我有一个data.frame,其中某些变量包含文本字符串。我希望计算每个字符串中给定字符出现的次数。 例: q.data<-data.frame(number=1:3, string=c("greatgreat", "magic", "not")) 我希望为q.data创建一个新列,其中出现字符串的数量为“ a”(即c(2,1,0))。 我管理的唯一复杂方法是​​: string.counter<-function(strings, pattern){ counts<-NULL for(i in 1:length(strings)){ counts[i]<-length(attr(gregexpr(pattern,strings[i])[[1]], "match.length")[attr(gregexpr(pattern,strings[i])[[1]], "match.length")>0]) } return(counts) } string.counter(strings=q.data$string, pattern="a") number string number.of.a 1 1 greatgreat 2 2 2 magic 1 3 3 not 0
103 regex  r  dataframe 

6
如何使用iPython中的pandas库读取.xlsx文件?
我想使用python的Pandas库读取.xlsx文件,并将数据移植到postgreSQL表中。 到目前为止,我所能做的就是: import pandas as pd data = pd.ExcelFile("*File Name*") 现在,我知道该步骤已成功执行,但是我想知道如何解析已读取的excel文件,以便可以了解excel中的数据如何映射到变量数据中的数据。 我了解到,如果我没有记错的话,数据就是一个Dataframe对象。因此,我如何解析此dataframe对象以逐行提取每一行。

6
创建零填充的熊猫数据框
创建给定大小的零填充熊猫数据框的最佳方法是什么? 我用过了: zero_data = np.zeros(shape=(len(data),len(feature_list))) d = pd.DataFrame(zero_data, columns=feature_list) 有更好的方法吗?
103 python  pandas  dataframe 

7
使用熊猫比较两列
以此为起点: a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']] df = pd.DataFrame(a, columns=['one', 'two', 'three']) Out[8]: one two three 0 10 1.2 4.2 1 15 70 0.03 2 8 5 0 我想if在熊猫中使用类似声明的内容。 if df['one'] >= df['two'] and df['one'] <= df['three']: df['que'] = df['one'] 基本上,通过if语句检查每一行,然后创建新列。 文档说要使用,.all但没有示例...


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.