扎实的数学知识是掌握ML的必备条件吗?–对被概念化为统计数据的机器学习的答案和推测;-)
在1990年左右,我曾希望计算机代数能有所帮助,我想是有帮助的,但是它相当有限。但这无疑有助于加快数学的学习(不需要通过练习来发展操纵技能,也不需要通过简单的练习就可以掌握技能)。我发现Fred Szabo的Mathematica线性代数就是一个很好的例子(但是我已经学习了高级理论水平的线性代数课程。)
自1988年以来,我一直在工作(利用计算机密集型方法“精确地”精确化统计的定理和原理),使答案完全没有(或至少没有必要)(对于统计)。人们将始终能够通过额外的数学技能和理解来更快,更普遍地理解。我想我已经开始接近了,但是人们需要一种可操纵的概率生成模型和推论,该模型不仅对玩具问题有效而且有用。
在继续学习ML之前,我应该尝试填补数学的空白吗?
这是一项艰苦的努力–在MHO中,几乎所有了解统计信息的人都是通过非常舒适地操作标准而达到目标的,尤其是概率生成模型的标准数学表示形式和推理的数学特征(数学统计Phds的最高x%)。因此,不仅要掌握基础知识,还要对数学真正感到满意。(顺便说一句,对我来说,傅立叶理论至关重要。)
为什么这些表示很难(即使有很多数学运算)?
Gerd Gigerenzer几乎已经确定,只要使用_自然频率测试阳性/阴性问题,简单的疾病阳性/阴性就不会面临挑战。链接问题的参考文献似乎很好地利用了该http://www.autonlab.org/tutorials/prob18.pdf
为什么很难一概而论?
对于k个测试(重复的和/或不同的)– 2 ^ k
对于采用v值的测试– v ^ k
因此对于二进制未知数– 2 * v ^ k样本路径概率
对于p多个二进制未知数2 ^ p * v ^ k
对于p个多重有理未知数Q ^ p * v ^ k
人们迅速转向数学,无穷无尽的数字可以解决这一问题,即使具有数学专业知识,数学也会导致许多误解和看似悖论(例如Borel悖论?)。
此外,还有线性到非线性的危险误解(例如,指定非信息性先验Winbug和其他MCMC的隐性危险,而没有事先分发的信息)以及交互作用和随机效应等。