Questions tagged «dataframe»

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框”或“数据框”是几种语言用于此概念的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),但“表”是MATLAB和SQL。

6
合并R中的两个列表
我有两个清单 first = list(a = 1, b = 2, c = 3) second = list(a = 2, b = 3, c = 4) 我想合并这两个列表,所以最终的产品是 $a [1] 1 2 $b [1] 2 3 $c [1] 3 4 有一个简单的功能可以做到这一点吗?
75 r  list  dataframe 

4
R对特定数据框列的Apply()函数
我想在数据框上使用apply函数,但仅将函数应用于最后5列。 B<- by(wifi,(wifi$Room),FUN=function(y){apply(y, 2, A)}) 这将A应用于y的所有列 B<- by(wifi,(wifi$Room),FUN=function(y){apply(y[4:9], 2, A)}) 这仅将A应用于y的第4-9列,但是B的总收益去除了前3列...我仍然想要那些,我只是不想将A应用于它们。 wifi[,1:3]+B 也没有做我期望/想要的。
75 r  dataframe  apply 

10
如何通过对数据框中的列进行排序来快速形成组(四分位数,十进制等)
我看到很多的问题和答案再order和sort。有什么东西可以将向量或数据帧分类为分组(如四分位数或十分位数)?我有一个“手动”解决方案,但可能有一个经过小组测试的更好的解决方案。 这是我的尝试: temp <- data.frame(name=letters[1:12], value=rnorm(12), quartile=rep(NA, 12)) temp # name value quartile # 1 a 2.55118169 NA # 2 b 0.79755259 NA # 3 c 0.16918905 NA # 4 d 1.73359245 NA # 5 e 0.41027113 NA # 6 f 0.73012966 NA # 7 g -1.35901658 NA # 8 …
75 r  sorting  dataframe 

3
优雅的索引,直到向量/矩阵的结尾
在R中是否可以说-我想要从位置i到向量/矩阵结尾的所有索引?假设我要从第3列开始添加子矩阵。我目前只知道这种方式: A = matrix(rep(1:8, each = 5), nrow = 5) # just generate some example matrix... A[,3:ncol(A)] # get submatrix from 3rd column onwards 但是我真的需要写ncol(A)吗?从“第三栏起”说出来没有优雅的方法吗?像A[,3:]什么?(或A[,3:...])?
74 r  matrix  dataframe  indexing 

2
R中的数据框和列表有什么区别?
dataframe和list in有什么区别R?什么时候应该使用哪一个?哪个更容易循环? 确切的问题:我必须先存储3个字符串元素,例如“ a”,“ b”,“ c”。稍后,对于每个这些,我需要再添加3个元素;例如对于“ a”,我必须添加“ a1”,“ a2”,“ a3”。稍后,我必须使用嵌套的for循环来访问这些元素。 所以我很困惑使用数据框或列表或其他某种数据类型,我可以先在其中存储然后追加(每列的类型)? 目前,我遇到错误,例如“要替换的项目数不是替换长度的倍数”
74 r  list  dataframe 



9
Pandas DataFrame将列表存储为字符串:如何转换回列表?
我有一个n × m的Pandas DataFramedf定义如下。(我知道这不是最好的方法。这对于我在实际代码中尝试做的事情是有道理的,但这将是本文的TMI,所以请相信我,这种方法可以在我的特定情况下使用) >>> df = DataFrame(columns=['col1']) >>> df.append(Series([None]), ignore_index=True) >>> df Empty DataFrame Columns: [col1] Index: [] 我将列表存储在此DataFrame的单元格中,如下所示。 >>> df['column1'][0] = [1.23, 2.34] >>> df col1 0 [1, 2] 由于某种原因,DataFrame将此列表存储为字符串而不是列表。 >>> df['column1'][0] '[1.23, 2.34]' 我有两个问题要问你。 为什么DataFrame将列表存储为字符串,并且有解决此问题的方法? 如果没有,那么是否有Python方式将这个字符串转换为列表? 更新资料 我正在使用的DataFrame已保存并从CSV格式加载。这种格式而不是DataFrame本身将列表从字符串转换为文字。

5
如何在for循环中在pandas数据框中追加行?
我有以下for循环: for i in links: data = urllib2.urlopen(str(i)).read() data = json.loads(data) data = pd.DataFrame(data.items()) data = data.transpose() data.columns = data.iloc[0] data = data.drop(data.index[[0]]) 这样创建的每个数据框都具有与其他列相同的大多数列,但不是全部。而且,它们都只有一行。我需要的是将for循环产生的每个数据帧的所有不同列和每一行添加到数据帧中 我尝试了串联或类似的大熊猫,但似乎没有任何效果。任何想法?谢谢。

5
有条件地替换data.frame中的值
我试图了解如何在不使用循环的情况下有条件地替换数据框中的值。我的数据框的结构如下: > df a b est 1 11.77000 2 0 2 10.90000 3 0 3 10.32000 2 0 4 10.96000 0 0 5 9.90600 0 0 6 10.70000 0 0 7 11.43000 1 0 8 11.41000 2 0 9 10.48512 4 0 10 11.19000 0 0 和dput输出是这样的: structure(list(a = c(11.77, …
73 r  dataframe 


3
将数据帧转换为向量(按行)
我有一个带有这样的数字条目的数据框 test <- data.frame(x = c(26, 21, 20), y = c(34, 29, 28)) 如何获得以下向量? > 26, 34, 21, 29, 20, 28 我可以使用以下方法获得它,但我想应该有一种更优雅的方法 X <- test[1, ] for (i in 2:dim(test)[ 1 ]){ X <- cbind(X, test[i, ]) }
72 r  dataframe  vector  r-faq 


5
Python Pandas复制数据框中的行
如果数据如下所示: Store,Dept,Date,Weekly_Sales,IsHoliday 1,1,2010-02-05,24924.5,FALSE 1,1,2010-02-12,46039.49,TRUE 1,1,2010-02-19,41595.55,FALSE 1,1,2010-02-26,19403.54,FALSE 1,1,2010-03-05,21827.9,FALSE 1,1,2010-03-12,21043.39,FALSE 1,1,2010-03-19,22136.64,FALSE 1,1,2010-03-26,26229.21,FALSE 1,1,2010-04-02,57258.43,FALSE 我想复制IsHoliday等于TRUE的行,我可以这样做: is_hol = df['IsHoliday'] == True df_try = df[is_hol] df=df.append(df_try*10) 但是是否有更好的方法来执行此操作,因为我需要将假日行重复5次,如果使用上述方法,则必须追加5次。

6
Python Pandas:读取Excel文件时如何指定数据类型?
我正在使用该pandas.read_excel()功能将Excel文件导入到熊猫数据框。 列之一是表格的主键:是所有数字,但以文本形式存储(Excel单元格左上角的绿色小三角形确认了这一点)。 但是,当我将文件导入pandas数据框时,该列将作为浮点导入。这意味着,例如“ 0614”变为614。 导入列时是否可以指定数据类型?我知道在导入CSV文件时这是可能的,但找不到的语法read_excel()。 我能想到的唯一解决方案是在Excel中的文本开头添加一个任意字母(将“ 0614”转换为“ A0614”),以确保将列作为文本导入,然后切掉“ A”在python中,因此我可以将其与我从SQL导入的其他表进行匹配。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.