1
预测性能更多地取决于数据分析师的专业知识,而不是方法?
我曾经谣传过一些研究表明,预测模型的性能更多地取决于使用所选方法的数据分析师的专业知识,而不是方法的选择。 换句话说,声称从更理论的角度来看,数据分析人员熟悉所选方法比该方法对问题的“合适性”显得更为重要。 这是在化学计量学的背景下提到的,它通常涉及许多变量(100s-1000s),多重共线性,当然样品太少的问题。预测可能是分类或回归。 我的个人经验表明,这是有道理的,但是有人提到了一项研究(我通过快速但不成功的搜索通过电子邮件问到提到这一点的人,但从未收到任何答复)。但是,通过更精细的搜索,我也无法找到任何论文。 有人知道这样的发现吗?如果没有,这里的大佬们的亲身经历怎么说?