我的numpy数组用于np.nan
指定缺失值。当我遍历数据集时,我需要检测这些缺失值并以特殊方式处理它们。
我天真地使用过numpy.isnan(val)
,除非val
不在所支持的类型子集中,numpy.isnan()
。例如,字符串字段中可能会丢失数据,在这种情况下,我得到:
>>> np.isnan('some_string')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: Not implemented for this type
除了编写昂贵的包装程序以捕获异常并返回之外 False
,还有没有办法优雅而有效地处理此问题?
@Marius:
—
2013年
pandas.isnull()
似乎工作正常。我当前处理的唯一数据类型numpy.isnan()
是字符串,并pandas.isnull()
能很好地处理它。实际上,它似乎可以很好地处理我扔给它的所有任意对象。您是否有任何关注的具体问题?否则,您可能希望将评论作为完整的答案提交,因为这似乎是规范的答案,至少对于熊猫用户而言。
pandas
具有pandas.isnull()
:我不确定这是否满足您的需求,因此一些示例数据可能很好。