我想将目录中的多个csv文件读入pandas,并将它们连接成一个大的DataFrame。我还无法弄清楚。这是我到目前为止的内容:
import glob
import pandas as pd
# get data file names
path =r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
# Concatenate all data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)
我想我在for循环中需要一些帮助吗???
big_frame = pd.concat(dfs, ignore_index=True)
吗?无论如何,一旦有了数据帧列表,您就需要遍历该列表并连接到big_frame
dfs
,因此for df in dfs: big_frame.concat(df, ignore_index=True)
应该可以进行类似的操作,也可以尝试append
而不是concat
也可以。
concat
应该像您一样处理DataFrames列表。我认为这是一个非常好的方法。
dfs
列表,你不希望替换行data = pd.read_csv(filename)
用dfs.append(pd.read_csv(filename)
。然后,您需要遍历列表和concat
,我认为concat
不会在df
s 列表上工作。