我正在使用pandas库读取一些CSV数据。在我的数据中,某些列包含字符串。该字符串"nan"
是一个可能的值,一个空字符串也可以。我设法让大熊猫将“ nan”读取为字符串,但是我不知道如何获取不读取空值的NaN。这是示例数据和输出
One,Two,Three
a,1,one
b,2,two
,3,three
d,4,nan
e,5,five
nan,6,
g,7,seven
>>> pandas.read_csv('test.csv', na_values={'One': [], "Three": []})
One Two Three
0 a 1 one
1 b 2 two
2 NaN 3 three
3 d 4 nan
4 e 5 five
5 nan 6 NaN
6 g 7 seven
它正确地写着“男”为字符串“南”,但仍读取空单元格作为NaN的。我想传递str
的converters
参数read_csv(带converters={'One': str})
),但它仍然读取空单元格作为NaN的。
我意识到我可以在读取后使用fillna填充值,但是真的没有办法告诉熊猫特定CSV列中的空单元格应被读取为空字符串而不是NaN吗?
keep_default_na
下面的更新选项来回答更简单的问题。