3 对于非线性数据,是否应尽可能使用内核技巧? 我最近了解了内核技巧的用法,该技巧将数据映射到更高维度的空间,以尝试线性化那些维度中的数据。在任何情况下我都应避免使用此技术?仅仅是找到正确的内核功能的问题吗? 对于线性数据,这当然无济于事,但对于非线性数据,这似乎总是有用的。就训练时间和可伸缩性而言,使用线性分类器比非线性分类器容易得多。 13 machine-learning svm kernel-trick heuristic
3 根据理论,拟合或其他方式选择分布更好吗? 这是一个哲学问题,但是我对其他有更多经验的人如何考虑分配选择感兴趣。在某些情况下,似乎很显然,理论可能最有效(小鼠尾巴的长度可能呈正态分布)。在很多情况下,可能没有理论来描述一组数据,因此,无论原始开发用来描述什么,您都可以使用非常适合您的数据。我可以想象使用其中的一个或另一个会遇到一些陷阱,然后当然存在一个问题,就是如果您真的不知道,也许应该只使用经验分布。 所以我想我真正要问的是:有人是否有一致的方式来处理/思考这个问题?您是否有任何资源可以建议对此进行良好处理? 12 distributions overfitting heuristic
1 为什么我们不能凭直觉相信自己的直觉? 如果有的话,蒙蒂·霍尔(Monty Hall)问题会变得很明显。甚至伟大的保罗·埃多斯(Paul Erdos)也被这个问题所迷惑。我可能很难回答的问题是,我们对一个答案如此自信而又凭直觉争论却又如此错误的可能性是什么?本福德的第一位数字定律和等待时间悖论是其他类似的著名例子。 10 probability conditional-probability paradox heuristic