我尝试将文件读入熊猫。该文件具有以空格分隔的值,但是我尝试使用不同数量的空格:
pd.read_csv('file.csv', delimiter=' ')
但这不起作用
Answers:
添加delim_whitespace=True
参数,它比正则表达式更快。
delimiter=' '
因为它们在最新版本中是互斥的。
delimiter=' '
非常脆弱,它说期望只有一个空间。delimiter='\s+'
大熊猫建议不要使用制表符,新闻线,多个空格,不间断的空格,这些的组合等,它们更可靠。
您可以使用正则表达式作为分隔符:
pd.read_csv("whitespace.csv", header=None, delimiter=r"\s+")
engine = "python"
以避免警告。