我正在寻找一个网站或书籍,其中逐步给出了几个实际示例,解释了他们如何选择相关功能,模型选择过程等......
数据科学项目逐步解释?
如果您想要一本面向应用程序的书,请考虑 Christopher Bishop 的基于模型的机器学习。他有更多备受推崇的技术书籍。
如果您正在寻找大量代码,那么黑客的概率编程和贝叶斯方法是一个选择。
另一本更具统计倾向的介绍性书籍是An Introduction to Statistical Learning with Applications in R。同样,作者拥有这本书的备受推崇的技术版本。
几周前我也有同样的问题。
我个人发现 O'Reilly 的Python for Data Analysis在学习基础知识方面非常有用。这本书假设你有一些 Python 编程经验,但它后面还有一个附录来了解基础知识。
作者在一开始就为您提供了各种各样的现实世界(不是 Monty Python)示例,您可以在前几章中创建这些示例,然后随着本书的深入,详细介绍每件事,从而建立您的知识。
我发现这些说明非常简单,一步一步来。我的教授是我这一切的向导,我学得如此之快给我留下了深刻的印象。
我也听说过关于 Kaggle 的好消息。
使用 Microsoft Azure 机器学习和 R 实现云中的数据科学是一本免费教科书,其中详细介绍了一个示例。不要被使用的特定工具吓到,因为你不需要它们来从书中获得一些好处。
我喜欢的另一个是集体智能编程,它也详细经历了许多项目,包括大多数书籍掩盖的网络抓取部分。
我可以推荐这个 Ipython Notebooks 集合,其中包括 Data Science、Statistics 和 Machine Learning 注释笔记本。
https://github.com/ipython/ipython/wiki/A-gallery-of-interesting-IPython-Notebooks