统计学家做什么不能自动化?

机器算法验证 机器学习 数据集 职业生涯
2022-02-10 10:45:44

软件最终会让统计学家过时吗?哪些事情不能被编程到计算机中?

4个回答

只有当强大的人工智能让人类整体过时时,计算机才会让统计学家过时。

这个问题让我想起了这样一个问题:“如果有所有这些强大的统计方法,为什么人们仍然使用其他方法?” 一些答案是习惯和训练,但大部分问题是这个问题很幼稚:正如问题所暗示的那样,“稳健”并不意味着“你不必考虑和理解你在做什么”。

我的意思是,你今天可以下载 R 统计包,并在夜幕降临之前做任何基本的统计技术。然后,您可以下载几个包并开始使用我们大多数人甚至没有听说过的深奥的方法。问题是:你会得到合理的答案吗?答案是:可能不会。

算法是自动化的,但你仍然需要在整个调查过程中做出许多判断:从攻击计划到最终判断结果是否真的有意义。要达到这一点,您实际上是在谈论类似于星际迷航的计算机,您可以在其中说“计算机,告诉我……”,到那时,几乎所有人类职业都已过时。

@Adam,如果您将统计研究人员与其他领域的研究人员类似地考虑-那些以现有方法和知识为基础的人-那么可能会更清楚地表明,您的第一个问题的答案是“否”。

统计学家很可能在每一步都被计算机取代,除了写论文的讨论部分,必须解释结果。所以,从这个意义上说,是的——它可以是自动化的(尽管它必须是一个复杂的软件,拥有一个地狱般的自然语言处理器)。

然而,正如大多数研究人员最终发现的那样,人们经常使用的“固定”例程非常有限,必须加以修改(或必须完全开发新方法)才能回答专门的研究问题——这就是统计学中人类方面不可或缺的地方. 或者,研究人员必须简单地解决一个可以使用经典方法回答的有点不同但相关的研究问题。

我认识的大多数统计学家都从事研究工作(例如教授、研究科学家),他们的主要职责是开发新方法。如果这个过程可以自动化,这意味着计算机可以制定和推出有用的新方法,那么恐怕每个领域的研究人员都会过时。

统计学家能做哪些计算机不能做的事情?编写他们被替换的原始程序。

除了这个有点愚蠢的答案之外,问题的根源在于忽略了统计的实际科学而偏向于它的机制,并且完全忽视了创造性过程在统计分析中的作用。这是,以彼得弗洛姆的汽车为例,就像说汽车是用铆钉和焊缝制造的,所以没有理由不能用铆接和焊接机器人来设计新的野马。

大量的统计工作涉及主题专业知识、判断要求和创造力。从算法运行的“预设”分析通常不会为您提供最佳答案,并且有无数记录在案的示例表明,使用自动化方法实际上会给您错误的答案——或者至少不是您认为得到的答案。使用基于逐步 p 值的变量选择程序和基于纯数字定义的分位数的分析是我最熟悉的两个,但我相信你可以在那里找到很多其他的。

即使所有这些仍然以某种方式自动化,也存在解释结果的问题。当您获得回归系数或 p 值时,统计学家(或具有统计学倾向的科学家)的工作并未完成。这个发现是什么意思有什么注意事项?在之前发生的情况下,这代表什么?

最后,您可以开发新方法。统计学不是很久以前由我们认识的人(Fisher、Cox 等)简单提出的东西。它是一个不断发展的领域,在一个人自己开发方法之前,你不能将新方法编程到计算机中。

解释这个问题的另一种方式可能是:“近年来自动化统计技术的快速增长是否与对专业统计学家和数据分析师的工作需求减少相对应?”

我们可以通过查看数据来解决这个问题 数据分析职位的就业市场
在此处输入图像描述

数据由 Indeed.com 和革命博客提供