关于在数据工程和机器学习领域继续前进的建议

数据挖掘 机器学习 数据工程 课程
2022-02-18 15:33:26

我在 Udemy 上完成了 28 小时的 Python 机器学习(基础课程),受益匪浅。

我的目标是能够理解什么是机器学习以及如何在处理数据时使用它的概念。

我对从哪里继续感到困惑。我的目标是成为一名数据工程师/分析师,或者至少是一名数据工程师。

我正在寻找 coursera 上的课程,因为它的可信度。

我找到了密歇根大学的一门课程:Applied data science with Python

但是我很困惑是否应该采取其他措施来开始我的数据科学工作搜索。我知道这将是一个漫长的过程。

关于如何继续这个旅程的任何建议,因为我真的很困惑。

如果不应该在这里提出问题,请随时删除我的问题。

3个回答

Dataquest是一个很好的起点。它将帮助您弥合从仅仅学习到作为数据分析师、数据工程师或数据科学家实际编码的差距。与大多数在线课程不同,它没有视频,它们提供了一个交互式编码和学习环境,可以很容易地学习处理实际数据和问题所需的实用技术。

Dataquest 最好的部分是他们的指导项目,这些项目是您学习的每个主题的一部分。如果你想最终获得一份数据分析师、科学家或工程师的工作,你将需要一个项目组合来展示你所知道的,而 Dataquest 可以帮助你完成整个过程。

fast.ai是另一个学习机器学习,尤其是深度学习的好地方,完全免费。他们使用自上而下的方法进行教学,让您立即处理自己的项目和数据。

要成为一名一般称职的数据科学家,您需要具备三个方面的知识:

  1. 统计/数学知识

  2. 编程 / CS 技能

  3. 领域知识

我认为学习和课程在 1) 中有所帮助,在 2) 中有所帮助,但在 3 中根本没有。如果你对 1/2 有足够的信心可以解决一些现实生活中的案例,那么最好开始做项目(Kaggle ,您自己的项目等)。

否则,您应该专注于以面向目标的方式结合 1 和 2 的应用课程。我非常偏爱 Kaggle 微课程,因为它们体积小、实用且速度快,但你需要一些基础来做这些。

首先,恭喜您开始了成为数据工程师/分析师的旅程。在我看来,如何成为一名数据分析师并没有明确的道路。

应用数据科学与 Python 课程很棒,但我会敦促您开始研究任何领域(NLP、CV)的问题陈述并参加比赛,您将学习如何可视化数据和使用大量数据集,这是关键成为数据工程师/分析师的要求。在这个过程中,您无论如何都会了解您需要学习和应用来解决问题陈述的内容。

请记住,这将是一个漫长的旅程,所以继续忙碌吧!