我想将目录中的多个csv文件读入pandas,并将它们连接成一个大的DataFrame。我还无法弄清楚。这是我到目前为止的内容:
import glob
import pandas as pd
# get data file names
path =r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
# Concatenate all data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)
我想我在for循环中需要一些帮助吗???
big_frame = pd.concat(dfs, ignore_index=True)吗?无论如何,一旦有了数据帧列表,您就需要遍历该列表并连接到big_frame
dfs,因此for df in dfs: big_frame.concat(df, ignore_index=True)应该可以进行类似的操作,也可以尝试append而不是concat也可以。
concat应该像您一样处理DataFrames列表。我认为这是一个非常好的方法。
dfs列表,你不希望替换行data = pd.read_csv(filename)用dfs.append(pd.read_csv(filename)。然后,您需要遍历列表和concat,我认为concat不会在dfs 列表上工作。