数据科学职业:从研究员到数据科学家
数据挖掘
初学者
职业
2021-10-11 09:29:26
4个回答
好问题!我很感激你有一个统计数据可以使用。大多数数据科学家——尤其是那些去这些数据“营地”或其他什么的——没有这个,它应该在你的职业生涯中为你服务。以下是您的问题的一些答案,按顺序排列:
- 你的背景会对你有所帮助,因为你习惯于学习设计和执行以及处理数据等事情。但我没有看到任何特定于 HCI 的内容会对您有所帮助。当你是一名优秀的数据科学家时,数据本身就显得不那么重要了。现在,当我从事一个项目时,我关心数据是以可持续的方式收集的,但数据是什么并不重要。最终你也会达到这个目标——这只是数字和数学:-)
- 你有统计方面。所以现在您需要 (1) 编程技能和 (2) 建模技能。你应该选择学习像 Python 或 R 这样的语言并在那里发展你的技能。从那里开始,您应该开始查看相关库,例如 Tensorflow 和 Keras,以帮助您建立建模技能。您还应该选择一本教科书或其他一些资源,这些资源会讨论模型实际做什么以及如何调整它们,与您选择的语言无关。最后,您将准备好对神经网络及其工作原理进行一些研究。这里成功的衡量标准是能够在 Tensorflow 中编写一些“传统”模型(如回归、决策树等),并且还能够在 Keras 中编写神经网络。
我认为你已经在实验和(大概)应用科学方法的基础将很好地为你服务,并且已经让你领先于大多数数据科学家。现在,只需能够用代码完成所有这些工作,如果您按照上述步骤操作,我想您将看到这些联系以及如何进入数据科学世界。
我建议您阅读 Gareth James 的《统计学习简介》。请务必在 Coursera 上查看 Andre Ng 的机器学习简介。真的很好地理解了数据科学的全部意义。选择 R 或 Python,查看 Kaggle.com,你会更好地了解下一步应该做什么
根据你想成为什么样的数据科学家,你可能已经准备好开始疯狂地申请工作了。我工作的数据科学研发团队(在一家财富 5 强公司)倾向于重视具有技术背景的批判性思维技能,而不是任何用某种语言编程的能力或实现任何单一模型的能力。
这取决于数据科学的职位,但在行业中,人们非常关注收集好的数据,而不是调整算法。工业中通常使用更简单的模型。数据科学家通常是面向客户(或利益相关者)的,因为他们是了解他们需要什么数据的最佳人选。他们也是谈论结果的最佳人选。一定要考虑这个角度。
我相信这个问题应该给你一些见解:https ://stats.stackexchange.com/questions/355390/industry-vs-kaggle-challenges-is-collecting-more-observations-and-having-access/355524#355524
其它你可能感兴趣的问题