为什么统计、机器学习和运筹学作为独立的实体脱颖而出

机器算法验证 机器学习 统计学意义 行动调查
2022-03-25 06:49:25

看来现在工作的人Statistics, Machine Learning and Operations research所有人都认为自己从事数据分析工作。这三个类别试图通过不同的方法解决类似的问题。根据我的理解,统计、机器学习和运筹学之间的不同特征如下:

1)Statistics提供了最严格的数学,但是,要在严格的数学下工作,通常统计学家会提供很多假设。这些假设背后的原因主要是为了保持可解释性和数学严谨性。统计学家真正关心解释和检查结果,例如假设检验

2) 的Machine Learning社会似乎能够以可解释性为代价,在更宽松的假设下工作。大多数机器学习方法都是基于算法的。这些算法需要的假设更少,并且似乎比类似的统计技术提供了更好的结果,但是在许多情况下,机器学习者确实无法解释结果或背后有严格的理由。在我们无法理解底层过程(例如深度学习)的情况下,这些算法似乎很有效,但也很危险。

3)Operations Research似乎主要关注马尔可夫建模和优化。马尔可夫建模受到现实生活中限制的独立增量属性的影响。同时,可以根据类似于机器学习中提出的算法来理解优化。

以上是基于我的理解,我非常感谢关于这三个类别之间的细微差异和相似之处以及为什么它们都作为独立实体脱颖而出的反馈

2个回答

在机器学习中“编程”=编写算法,在运筹学中“编程”=优化?

更严肃的回答,我认为差异更多的是历史血统和应用领域,而不是技术本身。我发现有趣的(学术)统计与机器学习文化的一种观点是“统计障碍”

统计学是最古老的,起源于数学和概率,可能在19 世纪后期成为一门独特的学科(尽管大部分理论都比较老)。在这三者中,统计学可能与“学术科学”最相关,当然也最关心实验设计和数据收集的严格方法。

运筹学似乎起源于二战时期,并且通常与大型组织(例如军事、物流/供应链、工业工程)相关联,专注于管理和优化他们的“运营”。

(就具有悠久历史的“数据科学”传统而言,另一个重要的将是计量经济学。维基百科说它是经济学,而CV说它是统计数据,这是值得的!)

机器学习是最新的,但对我来说更加模棱两可,至少在大众媒体上,它本质上是对“人工智能”的重新命名。这种更广泛的意义包括许多方面,包括计算机视觉和概率机器人。然而,计算机科学是所有这些不可分割的一部分。

最后,我想说像“数据科学”和“分析”这样的流行语主要是营销术语。它们不太可能在这些社区的成员之间使用,而不是在与外人交流时(或当外人在他们之间交谈时)。

在我看来,差异更多的是文化而不是方法论。这三者在概率论、优化和线性代数方面都有共同的数学基础。我不同意其中任何一个比其他任何一个都更“严格”。每个领域都有自己的博士,他们做着令人费解的严谨和艰巨的研究。每个人也都有利用方法和启发式方法来完成工作的从业者。

就“分析”而言,INFORMS(美国 OR/MS 协会)一直在努力使“分析”的定义更加严格,直至开发出认证流程(Certified Analytics Professional)。考试的材料不仅仅涵盖统计学、机器学习或运筹学。