我将Pandas'ver 0.12.0'与Python 2.7结合使用,并具有如下数据框:
df = pd.DataFrame({'id' : [123,512,'zhub1', 12354.3, 129, 753, 295, 610],
'colour': ['black', 'white','white','white',
'black', 'black', 'white', 'white'],
'shape': ['round', 'triangular', 'triangular','triangular','square',
'triangular','round','triangular']
}, columns= ['id','colour', 'shape'])
该id
系列由一些整数和字符串组成。它dtype
在默认情况下是object
。我想将的所有内容转换id
为字符串。我试过了astype(str)
,产生下面的输出。
df['id'].astype(str)
0 1
1 5
2 z
3 1
4 1
5 7
6 2
7 6
1)如何将的所有元素转换id
为String?
2)我最终将id
用于为数据帧建立索引。与具有整数索引相比,在数据帧中具有String索引会降低速度吗?
astype
对我来说很好,至少在0.13.1版本中,也许0.12.0有错误?回答您的第二点,是的,它可能会比较慢,因为字符串比较不会比整数比较快,但是我会首先介绍它,这也取决于大小