这个问题可能会在这里或关于...
假设您的训练数据集同时包含分类数据和连续数据,例如:
Animal, breed, sex, age, weight, blood_pressure, annual_cost
cat, calico, M, 10, 15 , 100 , 100
cat, tabby, F, 5, 10 , 80 , 200
dog, beagle, M, 3, 30 , 90 , 200
dog, lab, F, 8, 75 , 80 , 100
可以预测的因变量是年度兽医成本。对于处理此类数据集的具体技术,我有些困惑。处理连续数据和分类数据混合的数据集的常用方法是什么?