领域知识在我们的职业中有多重要?

机器算法验证 职业生涯
2022-03-17 13:53:54

或者: 在输入工作时选择域是否会缩小您未来的域选择范围,从而缩小工作范围?

为了使这个问题尽可能广泛地适用......

  • 职业是指各种数据分析师,从统计学家到机器学习程序员再到数据挖掘者。
  • 想象一下,您被要求向包含不同年龄段的学生和专业人士的听众提供建议

也许是一个起点:

Kaggle 上的比赛表明,局外人可以胜过公司员工创建的模型(参见例如这里)。另一方面,我(有限的)工作经验使我得出结论,理解数据是如何以及在何处生成的,对于创建一个可以发生 Kaggle 竞赛之类的抽象环境是绝对必要的。此外,如果没有领域知识,我发现很难将结果报告给其他层/部门。有些人将最后一项技能与“新”职业“数据科学”的关键联系起来(参见例如此处此处)。

2个回答

我打个比方:在没有上下文的情况下解决统计问题就像蒙眼拳击。你可能会击倒你的对手,但你可能会在环柱上猛击你的手。

我主要与医学和社会科学研究人员一起工作。那里似乎有一种普遍的感觉,即适当的研究模型是

1)他们提出一个想法,收集数据,写下它,然后 2)他们把它交给我们“做统计”。

所以,我同意我们需要了解这些问题;当然,我们不需要像从业者那样对研究有充分的了解。这就是为什么我(和许多其他数据人员)可以与不同专业的人一起工作的原因。但是,我们对某个主题的了解越少,我们就越需要与专业人士互动以确保结果有意义。

我喜欢我所做的许多事情之一就是我可以学到很多不同的科目。

领域知识在我们的职业中有多重要?

  • 重要到足以为面向领域的数据分析赋予不同的名称(例如 -metrics:生物计量学、心理计量学、化学计量学……)

  • 领域知识和统计知识的结合是非常重要的

    • 实验设计,例如实用的./。统计可行性、特定领域规范、样本量规划
    • 指导数据分析(什么样的转换或预处理在物理/生物/化学上有意义?需要对原始数据进行哪些更正?,数据质量标准,启发式)
    • 检查结果是否可能有意义/正确
    • 结果的解释
      是一个分类器的特定领域解释的例子,这只是因为数据分析和光谱知识都在手边(“描述性 LDA 和光谱解释”部分)。试着想象一个没有光谱知识的数据分析师和一个不知道 LDA 的光谱学家之间需要多少沟通才能得出这样的解释。
    • 在已发表结果(缺乏)可重复性的背景下,人们担心进行的研究好像没有对该领域/问题/数据的进一步了解,参见例如 E. R: Dougherty: Biomarker development: Prudence, risk, and再现性,BioEssays,2012, 34, 277-279。
      Beck-Bornholt & Dubben可能会争辩说,结合更多的领域知识会提高好的科学思想的流行度(先验概率)。
    • 没有免费的午餐定理暗示了同样的方向。

    (我是一名化学计量学和光谱学专业的化学家,同时进行测量和数据分析)

输入工作时选择域是否会缩小您未来的域选择范围,从而缩小工作范围?

也许,但与此同时,您将能够在该领域获得更多专业知识,从而可以申请专业工作(我的经验是我们化学计量学家是一个非常需要的物种)。

而且,此外,您表明您能够加入新领域的工作。