是否可以使用机器学习作为学习统计数据的方法,而不是反之亦然?

机器算法验证 机器学习 教学
2022-03-30 05:39:13

在您会发现的每个机器学习教程中,都有一个共同点:“在开始本教程之前,您需要知道 x 数量的统计信息”。因此,使用您的统计知识,您将了解机器学习。

我的问题是这是否可以逆转。计算机科学专业的学生可以通过学习机器学习算法来学习统计学吗?这是否已经过测试?是否有已经出现这种情况的例子?

4个回答

我真的不建议使用机器学习来学习统计数据。机器学习中使用的数学通常是不同的,因为它真正强调了计算算法。即使是同一个概念的处理方式也会不同。

一个简单的例子是比较基本统计教科书和机器学习教科书之间对线性回归的处理。大多数机器学习课本都对“梯度下降”和其他优化技术等概念进行了大量处理,而统计教科书通常只会涵盖普通的最小二乘法(即使是这样)。

最后,机器学习在模型比较、采样等方面通常不会涵盖相同的材料。因此,虽然一些基本模型是相同的,但概念框架可能会有很大不同。

就像那个老笑话一样。当被问及方向时,哲学家说:“好吧,如果我想去那里,我不会从这里开始......”

虽然我认为每个“文化”都应该开放地相互学习,但他们看待世界的方式不同。

我认为通过学习机器学习算法来学习统计的问题在于,虽然 ML 算法从统计概念开始,但统计并不是从算法开始,而是从概率模型开始。

取决于你的意思。

基于对机器学习的了解,我对统计数据的了解越来越深入。(我以前更像是一个普通的 AI 人,并且没有很好的统计经验,但随着时间的推移,我对统计有了更多的理解和欣赏。)所以它当然是一个有用的门户。

然而,我在统计学方面大部分时间都是自学成才的,这留下了很多漏洞。我了解并使用了一些相当先进的技术,但我不必走得太远就会受到阻碍,而具有更坚实统计基础的人则不会。而且我认为这将适用于您使用机器学习作为学习统计方法的场景:您的知识将是脆弱的。

我真的不这么认为,因为统计学中有一些基本方面在机器学习中被简单地忽略了。例如,在统计学中,当将模型拟合到数据时,使用的差异函数(例如,G^2、RMSEA)是必不可少的,因为它们具有不同的统计特性。在机器学习中,它只是无关紧要,因此根本没有涉及。

当然有人可能会争辩说你以后可以学习这些东西,但是恕我直言,最好不要理解和关心一些问题,将来可能不关心它们,然后反过来。

干杯