Answers:
我本人处于这个位置,所以我会尽力提供一些见识。
首先,下载统计学习要素。它假定有演算和线性代数,尽管技术性很强,但编写起来也非常好。
其次(或首先)看看Andrew Ng的机器学习教程。
第三,获取一些数据,然后开始尝试分析数据。您将需要分为训练集和测试集,然后在训练集上构建模型并针对测试集进行测试。我发现R的插入符号包对于所有这些都非常有用。练习之后,再练习(几乎和其他所有东西一样)。
Tan,Steinbech和Kumar撰写的“数据挖掘入门”是目前最好的入门书籍
http://www.amazon.com/Introduction-Data-Mining-Pang-Ning-Tan/dp/0321321367
保存EoSL,以备不时之需。它更多地是参考。
我只添加了Tom Mitchell撰写的关于数据挖掘/机器学习的另一个非常好的教程资源。
他解释得很清楚,您也可以从他的网站上下载他的演示文稿(以及在那里观看他的演讲)。