使用SMOTE技术平衡数据集的最佳性能指标是什么
我使用smote技术对数据集进行过采样,现在有了平衡的数据集。我面临的问题是性能指标;精度,召回率,f1度量,不平衡数据集中的准确性要优于平衡数据集。 我可以使用哪种度量来表明平衡数据集可以改善模型的性能? 注意:平衡数据集中的roc_auc_score比数据集不平衡的roc_auc_score更好吗?是否可以认为它是一个很好的性能衡量指标?经过解释,我实现了代码,并得到了这个结果 import pandas as pd import numpy as np from sklearn import preprocessing import matplotlib.pyplot as plt plt.rc("font", size=14) from sklearn.svm import LinearSVC from sklearn.svm import SVC from sklearn.cross_validation import train_test_split,StratifiedShuffleSplit,cross_val_score import seaborn as sns from scipy import interp from time import * from sklearn import metrics X=dataCAD.iloc[:,0:71] …