Answers:
如果您想要一本面向应用程序的书,请考虑Christopher Bishop的基于模型的机器学习。他拥有更多备受赞誉的技术书籍。
如果您正在寻找大量代码,则可以选择“ 概率编程和贝叶斯黑客方法”。
另一本更具统计倾向的入门书是《 R中的统计学习及其应用入门》。同样,作者拥有本书的备受赞誉的技术版本。
带有Microsoft Azure机器学习和R的云中的数据科学是一本免费的教科书,其中详细介绍了一个示例。不要被所使用的特定工具所困扰,因为您不需要它们来从书中获得一些好处。
我可以推荐该系列的Ipython笔记本,其中包括数据科学,统计和机器学习评论的笔记本。
https://github.com/ipython/ipython/wiki/A-gallery-of-interesting-IPython-Notebooks
我遇到过的最好的书之一是Sebastian Raschka的Python机器学习。简单的示例,分步说明和适量的数学运算。
本书的结构涵盖了从数据清理到汇总和评估的整个过程。
看一下 :
https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/
这是一个循序渐进的教程,它将使您对数据探索,数据分析和构建预测模型的整个过程有所了解。
有关数据探索和特征工程(如何选择相关特征)的说明在此处:
https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/
请参阅此处的前5个数据集,其中包含教程并进行研究以获取实际经验:
还可以看看:
http://machinelearningmastery.com/machine-learning-in-python-step-by-step/
他在一个数据集上使用多个模型,这将使您对不同模型有基本的了解。
要了解有关模型选择的更多信息,请查看以下内容:
https://www.quora.com/Data-Science-How-do-Data-Scientists-perform-model-selection
上面的链接提供了该领域工作人员给出的答案。
要获得有关不同数据集的见解,您始终可以登录kaggle并参加比赛,并查看范围广泛的数据集,您可以在其中访问内核中的人员代码。当人们讨论使用不同模型解决问题及其方法时,Kaggle中的论坛会很有帮助。