数据科学项目逐步解释了吗?


10

我正在寻找一个网站或书籍,其中逐步提供了一些实际示例,解释了它们如何选择相关功能,模型选择过程等。

Answers:



1

几周前我有同样的问题。

我个人发现O'Reilly的Python for Data Analysis在学习基础知识方面非常有用。本书假定您具有python编程经验,但后面还提供了附录以介绍基础知识。

作者从一开始就可以在前几章中创建各种现实世界(而不是Monty Python)示例,然后在本书进行时详细介绍每件事,以增强您的知识。

我发现说明非常容易并且逐步进行。我的教授是我所有这些方面的指导,给我留下了深刻的印象,我很快学会了。

我也听说过有关Kaggle的好消息。





0

我遇到过的最好的书之一是Sebastian Raschka的Python机器学习。简单的示例,分步说明和适量的数学运算。

本书的结构涵盖了从数据清理到汇总和评估的整个过程。


0

看一下 :

https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/

这是一个循序渐进的教程,它将使您对数据探索,数据分析和构建预测模型的整个过程有所了解。

有关数据探索和特征工程(如何选择相关特征)的说明在此处:

https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/

请参阅此处的前5个数据集,其中包含教程并进行研究以获取实际经验:

https://www.analyticsvidhya.com/blog/2016/10/17-ultimate-data-science-projects-to-boost-your-knowledge-and-skills/

还可以看看:

http://machinelearningmastery.com/machine-learning-in-python-step-by-step/

他在一个数据集上使用多个模型,这将使​​您对不同模型有基本的了解。

要了解有关模型选择的更多信息,请查看以下内容:

https://www.quora.com/Data-Science-How-do-Data-Scientists-perform-model-selection

上面的链接提供了该领域工作人员给出的答案。

要获得有关不同数据集的见解,您始终可以登录kaggle并参加比赛,并查看范围广泛的数据集,您可以在其中访问内核中的人员代码。当人们讨论使用不同模型解决问题及其方法时,Kaggle中的论坛会很有帮助。

https://www.kaggle.com/

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.