数据科学职业:从研究员到数据科学家

数据挖掘 初学者 职业
2021-10-11 09:29:26

我目前在计算机科学领域担任研究助理,专攻人机交互 (HCI) 和健康信息学 (HI) 领域。作为我的职责的一部分,我从几位临床专业人员(临床医生、医师和医生)那里收集数据并对其进行分析(例如,t 检验ANOVA等)。转换分析的数据并将其组织成多个数据集,我们通过创建将为我们的分析奠定基础的科学论文来报告和使用它。

最近,我开始对数据科学领域产生了兴趣,我正在考虑往那个方向发展,成为一名数据科学家。正如我所提到的,我已经将统计分析作为我工作的一部分。这引发了几个问题:

  1. HCI 和数据科学领域如何相互关联?
  2. 如何从 HCI 领域的研究助理转变为数据科学职业?
  3. 我应该参加什么样的学习/课程?
4个回答

好问题!我很感激你有一个统计数据可以使用。大多数数据科学家——尤其是那些去这些数据“营地”或其他什么的——没有这个,它应该在你的职业生涯中为你服务。以下是您的问题的一些答案,按顺序排列:

  1. 你的背景会对你有所帮助,因为你习惯于学习设计和执行以及处理数据等事情。但我没有看到任何特定于 HCI 的内容会对您有所帮助。当你是一名优秀的数据科学家时,数据本身就显得不那么重要了。现在,当我从事一个项目时,我关心数据是以可持续的方式收集的,但数据什么并不重要。最终你也会达到这个目标——这只是数字和数学:-)
  2. 你有统计方面。所以现在您需要 (1) 编程技能和 (2) 建模技能。你应该选择学习像 Python 或 R 这样的语言并在那里发展你的技能。从那里开始,您应该开始查看相关库,例如 Tensorflow 和 Keras,以帮助您建立建模技能。您还应该选择一本教科书或其他一些资源,这些资源会讨论模型实际做什么以及如何调整它们,与您选择的语言无关。最后,您将准备好对神经网络及其工作原理进行一些研究。这里成功的衡量标准是能够在 Tensorflow 中编写一些“传统”模型(如回归、决策树等),并且还能够在 Keras 中编写神经网络。

我认为你已经在实验和(大概)应用科学方法的基础将很好地为你服务,并且已经让你领先于大多数数据科学家。现在,只需能够用代码完成所有这些工作,如果您按照上述步骤操作,我想您将看到这些联系以及如何进入数据科学世界。

我建议您阅读 Gareth James 的《统计学习简介》。请务必在 Coursera 上查看 Andre Ng 的机器学习简介。真的很好地理解了数据科学的全部意义。选择 R 或 Python,查看 Kaggle.com,你会更好地了解下一步应该做什么

根据你想成为什么样的数据科学家,你可能已经准备好开始疯狂地申请工作了。我工作的数据科学研发团队(在一家财富 5 强公司)倾向于重视具有技术背景的批判性思维技能,而不是任何用某种语言编程的能力或实现任何单一模型的能力。

这取决于数据科学的职位,但在行业中,人们非常关注收集好的数据,而不是调整算法。工业中通常使用更简单的模型。数据科学家通常是面向客户(或利益相关者)的,因为他们是了解他们需要什么数据的最佳人选。他们也是谈论结果的最佳人选。一定要考虑这个角度。

我相信这个问题应该给你一些见解:https ://stats.stackexchange.com/questions/355390/industry-vs-kaggle-challenges-is-collecting-more-observations-and-having-access/355524#355524