Questions tagged «categorical-data»


6
熊猫:将类别转换为数字
假设我有一个包含以下国家/地区的数据框: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 我知道有一个pd.get_dummies函数可以将国家/地区转换为“一次性编码”。但是,我希望将它们转换为索引,以便获取cc_index = [1,2,1,3]。 我假设有一种比使用get_dummies和numpy where子句更快的方法,如下所示: [np.where(x) for x in df.cc.get_dummies().values] 这在R中使用“因素”更容易做到,所以我希望熊猫也有类似的东西。

3
转换多个分类列
在我的数据集中,我想列举两个分类列。两列都包含国家,有些重叠(出现在两列中)。我想在同一国家的column1和column2中给出相同的数字。 我的数据看起来像: import pandas as pd d = {'col1': ['NL', 'BE', 'FR', 'BE'], 'col2': ['BE', 'NL', 'ES', 'ES']} df = pd.DataFrame(data=d) df 目前,我正在像这样转换数据: from sklearn.preprocessing import LabelEncoder df.apply(LabelEncoder().fit_transform) 但是,这在FR和ES之间没有区别。是否有另一种简单的方法可以得到以下输出? o = {'col1': [2,0,1,0], 'col2': [0,2,4,4]} output = pd.DataFrame(data=o) output
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.