是否同时转换所有数据或折叠(如果应用了简历)?例如
(allData - mean(allData)) / sd(allData)
我是否要分别转换训练集和测试集?例如
(trainData - mean(trainData)) / sd(trainData)
(testData - mean(testData)) / sd(testData)
还是要转换训练集并在测试集中使用计算?例如
(trainData - mean(trainData)) / sd(trainData)
(testData - mean(trainData)) / sd(trainData)
我相信3是正确的方法。如果3是正确的,我必须担心平均值不为0或范围不在[0; 1]或[-1; 1](规范化)的测试集?
R
?看到这个问题:stackoverflow.com/questions/49260862/…–