4
对于不规则的分隔符,如何使pandas read_csv中的分隔符更灵活wrt空格?
我需要通过使用read_csv方法从文件中读取数据来创建数据框。但是,分隔符不是很规则:一些列由制表符(\t)分隔,另一些则由空格分隔。此外,某些列可以用2或3个或更多的空格隔开,甚至可以用空格和制表符的组合分隔(例如3个空格,两个制表符然后是1个空格)。 有没有办法告诉熊猫正确对待这些文件? 顺便说一句,如果我使用Python,则不会出现此问题。我用: for line in file(file_name): fld = line.split() 而且效果很好。不管字段之间是否有2或3个空格。即使空格和制表符的组合也不会引起任何问题。熊猫可以做同样的事情吗?