带回归的 Copulas

机器算法验证 回归 推理 系词
2022-04-06 10:50:53

Copulas 是均匀边缘分布的联合分布。传统上,我见过将 Copula 拟合到数据然后从数据中进行模拟的示例。

我对基于 Copula 的回归模型的了解不多。假设您将 copula 拟合到 m 个变量和响应中,

  1. 给定所有 m 个变量,我如何构造这个拟合 copula 的条件密度。是否可以将任意 copula wrt 与 m 个变量区分开来
  2. 如果我可以通过从 copula 基础到原始基础的转换来构建条件密度,我可以对其进行数值积分以获得给定因变量的响应的条件期望

有没有使用 copulas 拟合非线性回归模型的例子

2个回答

在我看来,这两种方法(copula,回归)回答了完全不同的问题。copula 方法比回归更通用,您没有看到基于 copulas 的回归模型的原因之一可能是使用 copulas 比使用回归困难得多。为什么会这样,有两个观察结果:

  • 对于 copula 拟合,您需要知道或估计所有相关变量的联合分布。回归不需要这个。
  • 如果您只对响应感兴趣,回归或多或少会直接为您提供答案。但是从联合分布中,您需要付出额外的努力来制造响应的条件期望。

估计联合分布的额外努力,然后才找到预期的响应,需要通过您感兴趣的特定问题来证明。我能想到的两个理由是:您实际上对联合分布感兴趣(这就是您称为“传统上”)或者您知道您的模型不允许回归的标准假设(例如,加法独立误差)。

关于你的问题 1. 和 2.:当然你可以在理论上做到这一点(如果 copula 是可微分的并且有密度)。如果您知道联合分布,则可以计算所有边际和条件期望。当您想从数据中估计这一点时,问题就开始了。除非您的问题规定了一个特定的、良好的参数 copula,否则您可能需要特殊样本或大量样本来执行此操作。

我最近为基于 copula 的两个随机变量之间的关系设计了一种曲线拟合方法:基于 Ångström-Prescott 型关系的积分回归,可再生能源,第 127 卷,2018 年,第 713-723 页,ISSN 0960-1481, https ://doi.org/10.1016/j.renene.2018.05.004http://www.sciencedirect.com/science/article/pii/S0960148118305238) 摘要:我们提出了一种确定两个随机变量之间关系的新方法,我们称之为积分回归。所得曲线是最小绝对误差估计。与其他回归方法相比,它的优点是不需要同时抽取两个随机变量对的样本,而只需要每个随机变量的单独样本。我们证明了该方法在 Ångström-Prescott 型关系上的实用性,并将结果与​​通过最小二乘误差拟合获得的结果进行比较。我们提供了基于 copula 的支持性理论背景信息。我们表明,积分回归导致两个随机变量的严格相互依赖;Spearman 的 rho 等于 1。关键词: Ångström-Prescott 关系;系词; 曲线拟合;积分回归;随机变量