简单、多元、单变量、双变量、多变量 - 术语

机器算法验证 多重回归 多元分析 多元回归 双变量 单变量
2022-03-15 07:41:13

我确实意识到(其中一些)这已经在这里解决了(例如,为什么我们需要多元回归(而不是一堆单变量回归)?,解释多元回归和多元回归之间的区别,最少使用符号/数学定义单变量回归)。不过,我希望我能对此有更多的了解。

标题中的术语有什么区别?这是否会有所不同(因此会导致混淆)?还是有一个合适的术语,而有些人只是使用不正确?

  1. 例如,据我了解,简单(线性)回归将是我们有一个响应和一个解释变量的地方。多元(线性)回归是指我们有一个响应多个解释变量到目前为止一切顺利 - 我还没有在这里感到困惑。

  2. 但是当有人说“多变量”时,这是否意味着多个RESPONSES或多个解释变量(或两者)?我假设前者(也从提供的链接判断),但人们似乎可以互换使用这些。通过扩展,“单变量”可能意味着单一响应

  3. 此外,术语“多变量分析”(PCA、判别分析等)通常意味着多重响应,对吧?

  4. 最后,术语“双变量”。祖尔等人。2009(混合效应模型和生态学与 R 的扩展)指出:

    变量线性回归模型定义为:

    Yi=α+β×Xi+εi where εiN(0,σ2)

    这似乎是指一种响应和一种预测(即简单的线性回归)。那么,在这种情况下,“双变量”一词是否指总共两个变量(一个响应,一个预测变量)?

有一些标准术语还是只是一团糟?

2个回答

至于问题 1,你说的是对的。

至于问题 2多变量代表涉及多个响应变量的分析。据我所知,预测变量的术语没有区别。为了保持一致,可以说,但我不确定,当存在多个响应和一个预测变量时,“简单的多元回归”。

至于问题 3,我想说你又是对的。

至于问题4,术语双变量是指总共有两个连续变量的情况,即可以在二维散点图中可视化的分析(例如简单的线性回归和相关性)。

那么现在单变量也指的是什么?我认为(我可能错了)当您有一个响应和一个或多个分类预测变量时就是这种情况。因此,例如,您测量来自同一棵父树的树的高度,或者用不同饲料喂养的鸡的重量。这种类型的分析将被分析为 t 检验或方差分析。

当您可视化数据时,可以看到单变量双变量之间的差异。如果您将某些东西绘制为条形图(或点图),则它是univariate,如果您在 2d 散点图上绘制某些东西,它是bivariate我在这里可能是错的,但我相信如果是这样的话,有人会发表评论!

为预测变量,设为预测变量。yx

  1. 一个和一个 = 简单回归yx

  2. 一个和多个 = 多元回归yx

  3. 许多和一个 = 多元简单回归yx

  4. 许多和许多 = 多元多元回归yx

在实践中,因为这四种情况都可以并且通常都在同一个框架内处理(例如,一般线性建模),它们之间的差异纯粹是术语上的,而不是统计上的。但是,始终如一地使用这些术语可以增强沟通。

大卫 A 弗里德曼 (2009)。统计模型:理论与实践。剑桥大学出版社。

伦彻,阿尔文 C.;Christensen, William F. (2012),“第 10 章,多元回归”,多元分析方法,Wiley Series in Probability and Statistics(第 3 版),John Wiley & Sons,p。19.