我需要通过使用read_csv
方法从文件中读取数据来创建数据框。但是,分隔符不是很规则:一些列由制表符(\t
)分隔,另一些则由空格分隔。此外,某些列可以用2或3个或更多的空格隔开,甚至可以用空格和制表符的组合分隔(例如3个空格,两个制表符然后是1个空格)。
有没有办法告诉熊猫正确对待这些文件?
顺便说一句,如果我使用Python,则不会出现此问题。我用:
for line in file(file_name):
fld = line.split()
而且效果很好。不管字段之间是否有2或3个空格。即使空格和制表符的组合也不会引起任何问题。熊猫可以做同样的事情吗?
skipinitialspace
跳过初始空间