使用数学或机器学习进行线性回归?为什么还要为此使用机器学习?

数据挖掘 机器学习 线性回归
2022-03-02 13:59:14

我学过统计数学,现在正在学习机器学习课程。老师讲的第一个例子是如何使用机器学习找到线性趋势线。为什么会有人这样做?在我的统计课程中,根据我的理解,我们使用的计算机能力远低于机器学习方法使用的计算机能力计算数据集的线性趋势线。使用机器学习的线性回归只是学习机器学习基础知识的一个很好的例子,还是有任何现实世界的理由可以说明为什么有人会使用机器学习来找到如此简单的趋势线?

3个回答

无论您如何计算/估计参数,线性回归都是线性回归。

在大型多变量数据集的情况下,这个问题变得很重要,因为使用代数方程(又名拟合简单线)计算参数并不容易/快速/不可能。在这种情况下,随机梯度下降 (SGD) 等机器学习技术可能会有所帮助。

线性回归是许多估计因果模型的学科的工作马。例如,当您查看经济学时,您会发现线性回归被广泛使用。这样做的原因是您可以很容易地识别边际效应(某条线的斜率)。然而,大多数应用程序使用多元线性回归(许多X)。这些模型/回归通常非常复杂,将理论推理与统计相结合(在这种情况下称为计量经济学)。请参阅Wooldridge以获得很好的介绍。例如,看看“固定效应”或“方程组”。

预测建模方面,线性回归也主要用于多变量设置,例如与主成分(如X) 或作为多项式回归。在预测方面,它可能非常强大(在某些情况下)。线性回归模型的进一步扩展包括“广义加性模型”(GAM)或“收缩”以用于高维问题(例如套索、山脊)。请参阅ISL 以获得很好的概述

即使您仅拟合线性趋势线(单变量情况),线性回归在许多情况下也非常有用,因为您可以轻松计算置信带或 p 值等内容,以快速了解单变量线与某些情况的拟合程度数据。

你的老师对这些术语很感兴趣。正在发生的事情是您正在执行通常的线性回归,这恰好是所谓的监督学习中各种模型的简单、易于可视化的示例。但是,您不会因为该类被称为“机器学习”而做任何花哨的算法或模型。