计算科学和数据科学有什么区别?

计算科学 数据分析
2021-12-03 07:51:37

背景:我的博士学位是“计算科学”。我的论文是关于 X 射线衍射数据分析和热扰动核分析在固态物理分子电子密度的整体动态分析中。外卖?它非常基于科学。

在我看来,计算科学是对科学的追求,“......一个系统的企业,通过计算手段以可测试的解释和预测的形式构建和组织知识”(wiki )。

然而,“数据科学”的大多数职位似乎更像是“数据分析”类型的工作。即繁重的 SQL 查询,使用预先构建的 R 和 Python 模型(线性回归等)从结构化和非结构化数据中得出结论。

计算科学是数据科学的超集吗?它们可以互换吗?数据科学是真正的“科学”吗?计算科学是一门真正的“科学”吗?

1个回答

它们不可互换。

  • 计算科学往往更多地指代HPC、模拟技术(微分方程、分子动力学等),通常被称为科学计算。

  • 数据科学倾向于指计算密集型数据分析,如“大数据”、生物信息学、机器学习(优化)、使用 MCMC 的贝叶斯分析等。我认为它与过去所说的计算统计相同。这是计算机科学与统计学的融合,但许多开发的技术放弃了严格的费舍尔“统计测试”(聚类、交叉验证技术、数据可视化),但保留了数据部分。

当我在 Julia 的数据科学和科学计算研讨会上讲授时,我得到了最清楚的解释。数据科学家想学习 Julia 以便快速进行“大数据”分析,即大数据的回归和其他 GLM。计算科学家(科学计算机专家?)想知道如何轻松编写代码来解决 HPC 和 GPU 上的大型线性系统。

请注意,这是两种表示完全相同的计算的方式,但含义却截然不同。所以在某种意义上是相似的,但仍然是不同的(学科之间存在交叉,比如使用机器学习从数据中学习偏微分方程的参数)。