有哪些资源可以测试您的数据科学技能?

数据挖掘 机器学习 分类 回归
2021-10-04 17:41:07

我找不到工作来挽救我的生命,所以我猜我缺乏技能是一个问题。我一直在阅读大量有关统计数据的书,但我开始坐立不安了——我想从理论转向应用并测试我的技能,看看我如何与真正的从业者相提并论。

我拥有的大多数书籍都没有解决方案。他们有问题和实验室,但没有答案,我不知道我是否做得对。我知道在拟合模型方面,没有“正确”的答案,但肯定有不好的答案。我只是想确保我的答案足够好。

有哪些资源可以让我练习我的数据科学、统计推理、机器学习技能 - 并提供答案?我知道https://www.kaggle.com/competitions有任务,但现在这些似乎超出了我的能力 - 显然不会有正确的答案。

是否有网站可以测试您构建预测模型的能力?

有什么建议?

2个回答

如果你想从理论转向应用,那么我建议你这样做:让你得心应手的“脏”!

UCI 机器学习存储库有一些更容易上手的数据集。Kaggle 也很棒,但在参加任何比赛之前,请从他们的存储库中寻找更简单的数据集

如果您更喜欢有更多指导的东西,Mueller 和 Guido 的“Python 机器学习简介”一书包含许多从经典 Iris 数据集开始的示例。

最后,您可以考虑在线课程。Udacity 纳米学位包括您需要提交的项目,因此它提供了一些基本的实践经验。不过,在您的具体情况下,如果您认为这可能有助于您的简历,我只会走这条路。

做 Kaggle 问题是测试技能的好方法,也是提高技能的好方法。有些问题不需要先进的技术。例如,泰坦尼克号是一个介绍性问题。此外,还有许多问题的解决方案。你可以自己做一个问题,然后检查其他人是如何做的。