非线性统计?

机器算法验证 数理统计 参考 非线性
2022-04-15 21:23:50

我最近一直在学习统计学,使用了一些介绍性的课本。

我的问题是这些文本似乎只提供适用于线性关系的分析方法:Pearson r 相关系数等。此外,所有提出的统计方法似乎都基于正态高斯分布。

我的问题是哪些工具、方法和技术适用于非线性、非高斯统计分析,以及我可以使用哪些资源(特别是书籍/教科书)来熟悉这些程序?

3个回答

我将列出一些模型/方法,以便您可以更轻松地自行查找有关它们的信息(无论是在此处、维基百科和其他此类来源、通过谷歌、书籍和文章的标题等)。这不是一个完整的列表,但涵盖了一些更常见的方法。最后我还会提到一些参考资料和一些在线资源。

  1. 在回归框架内拟合曲线关系的简单方法 - 例如多项式回归,尽管可以使用三角函数和其他模型。

    多项式回归示例(从这里开始- 粉红色是每个的拟合值):x
    在此处输入图像描述

    三角回归(上面的链接): 在此处输入图像描述

  2. 可以使用变量的变换;一个常见的例子是使用Box-Cox系列的功率变换。其中是单独转换的,这本质上是前一种情况的一种形式。当双方都进行转换时,它可以处理非正态性、异方差性和弯曲关系,但同时平衡这三者有时会很棘手。通常情况下,使关系更加同方差可以改善常态(尽管通常不完全)。在将解释恢复到原始比例时,需要小心。xyx

    这是将非线性和强异方差的关系转换为更适合线性回归的关系的结果示例(来自此处):
    在此处输入图像描述

  3. 非线性回归-y=g(x)+ϵ

    是回归量向量)用于非线性函数关系(),假设高斯误差()或简单的平方误差损失函数。广泛用于物理科学(物理、化学等),但也可以在各种其他环境中找到。xgϵ

    一个例子(从这里黑色是数据,粉红色是拟合模型,):E(y)=β0+β1eβ2x
    在此处输入图像描述

    第二个例子(来自这里):
    在此处输入图像描述

  4. 广义线性模型(GLM)

    中为线性且方差是均值函数的函数的高斯和非高斯(在指数族内). 使用非常广泛。Yg[E(Y|X=x)]x

    二项式 GLM 与死亡率数据的拟合示例(,其中):E(dx)=Exqxqx=Abx1+Abx
    在此处输入图像描述

  5. 通过最大似然估计矩量法(MoM 或有时 MME)或其他方式拟合了更通用的模型。一般来说,为了产生估计值,指定了一些模型,最小化了一些损失函数,或者指定了一些其他拟合标准(如在 MoM 中);应用了各种优化或寻根方法。

  6. 平滑技术,包括回归样条、平滑样条(或任何一种的惩罚版本)、 平滑/局部线性回归/局部多项式回归(包括 LOESS 和其他局部回归方法)等。也在nonparametric regression的保护伞下,尽管它包括一些与您的问题不直接相关的其他技术。

    另请参阅广义加法模型

    示例(加权自然三次样条拟合对数转换数据):
    在此处输入图像描述

CV 上几乎所有这些主题都有大量信息。

这本书“ (An R and S-PLUS)Companion to Applied Regression ”(Fox 或最近的“ An R Companion to Applied Regression ”Fox & Weisberg)有许多相关章节(包括对变换和 GLM 的介绍,(还有此处是其他在线章节,尤其是该链接上的前几章,它们涵盖了非线性回归和非参数回归),您可能会发现它们很有用。

另请参阅 Fox、应用回归、线性模型和相关方法

一些模型/方法在统计学习要素(Hastie、Tibshirani 和 Friedman)中进行了讨论。第二版的第 10 版可在线获得,但它并不是特别介绍性的(尽管部分内容非常简单),而且它的重点与您可能追求的不同。不过,您可能会发现其中的一些章节很有价值。

我要补充一点,你感觉到的区别比看起来的要少。“非线性统计”实际上并不是一个连贯或标准的标签,尤其是因为它的定义是负面的而不是正面的。

  1. 关于线性:最大的好处是许多非线性都可以通过参数线性的模型来处理。您不必从入门课程中遇到的内容直接跳到非线性最小二乘。后者有时是一个好仆人,但往往是一个笨拙的主人。

  2. 正常:只有糟糕的书籍和课程假设甚至暗示这是一个案例或“正常或死亡”。现代统计学对于指数、伽马、对数正态、二项式、泊松或更多古怪的数据很酷。

  3. 介绍性和稍微高级一点的统计数据之间的最简单的桥梁是由转换的思想提供的,一些转换通常使非线性(更接近)线性和非正态(更接近)正态。

  4. 介绍性和上述内容之间的一个很好的桥梁是(这里的一些品味和判断的变化应该来自统计人员)通过广义线性模型的想法。我将从Dobson 和 Barnett之类的帐户开始,它很好地传达了您所知道的可以扩展的想法。

对此的最佳答案可能取决于您的学科,但我喜欢 Bruce Hansen 的计量经济学教科书(免费,在线):http ://www.ssc.wisc.edu/~bhansen/econometrics/Econometrics.pdf

请参阅第 9.1 节了解非线性最小二乘法——这些结果实际上与线性情况并没有太大区别。

您可能还对一些非参数技术感兴趣。同一个人在非参数方面也有很好的讲义。这是一个链接: http ://www.ssc.wisc.edu/~bhansen/718/718.htm