计算科学 - 具有非常小的数字的非负最小二乘 - 吾爱随笔录 - 问答

具有非常小的数字的非负最小二乘

计算科学约束优化最小二乘预处理可能性数值限制

2021-12-17 06:18:22

（我之前在 StackOverflow 上问过这个问题，但有人指出 CSSE 或 MSE 可能更合适）

我必须解决以下形式的约束优化问题，其中唯一的未知数是 $x$ ：

x^{*} = \arg min_{x} {‖ A x - b ‖}^{2} x \in R_{\geq 0}^{n}, A \in R_{\geq 0}^{n \times n}, b \in R_{\geq 0}^{n}

$x^{*} = \arg \min_{x} \left \| Ax - b \right \|^{2} \qquad x \in \mathbb{R}_{\geq 0}^{n} , ~ A \in \mathbb{R}_{\geq 0}^{n \times n} , b \in \mathbb{R}_{\geq 0}^{n}$

换句话说，一个非负最小二乘问题（NNLS）。或者，我可以解决一个线性程序（知道这些是不一样的，但我想要一个更方便的解决方案）：

minimize \sum_{i} ξ_{i}

$\text{minimize} \sum_i \xi_i$

subject to: A x = b + ξ

$\text{subject to:} ~~ Ax = b ~ + \xi$

x \in R_{\geq 0}^{n}, ξ \in R_{\geq 0}^{n}

$x \in \mathbb{R}_{\geq 0}^{n} , \xi \in \mathbb{R}_{\geq 0}^{n}$

现在到目前为止一切顺利。我的问题是我使用的矩阵 A 和向量 b 包含非常小的条目(1e-60,1e-100)。请注意，所有数字都大致如此之小。这是因为它们来自对高维 pdf 的评估。据我所知，即使是最精确的求解器也无法正确处理这些数字。我的算法的其余部分可以很好地处理这些数字，因为所有操作都是在对数空间中执行的，因为它在概率中很常见。

尝试使用我提出的任何一种方法来解决原始问题，即使用例如scipy.optimize.nnlsor scipy.optimize.linprog，导致求解器仅返回一个零向量。

可以考虑解决以下修改后的问题（例如）：

x^{* *} = \arg min_{x} {‖ \log (A) x - \log (b) ‖}^{2} x \in R_{\geq 0}^{n}, A \in R_{\geq 0}^{n \times n}, b \in R_{\geq 0}^{n}

$x^{**} = \arg \min_{x} \left \| \log (A) x - \log(b) \right \|^{2} \qquad x \in \mathbb{R}_{\geq 0}^{n} , ~ A \in \mathbb{R}_{\geq 0}^{n \times n} , b \in \mathbb{R}_{\geq 0}^{n}$

可以对前面显示的 LP 进行模拟修改。虽然这不会遇到相同的优化问题，但这个修改后的问题的最佳解决方案与原始问题的最佳解决方案不同。那是， $x^{*} \neq x^{**}$ 并且 $x^{*} \neq \exp(x^{**})$ . 解决这个修改后的问题并将其取幂并不会给出完全荒谬的结果，但对于我的目的来说还不够好。

尽管小条目给出了优化问题，我将如何解决原始问题 $A$ 和 $b$ ?

1个回答

要解决非常非常小的数字的问题，您需要使用任意精度的算术库，例如 MPFR。https://www.mpfr.org/

MPFR 非常棒，并且会不断提高精度，直到足以避免舍入误差或内存不足。根据我的经验，我从未使用超过 128 位尾数（双精度数类似于 53）。告别数字限制！你的程序会运行得更慢，但它会成功。

如果您首选的求解器不支持这种数据类型，您可以使用非常简单的梯度下降实现和变量更改来编写自己的求解器。

让 $x_i=y_i^2$ . 向量函数现在表示为 $F=Ay^2-b$ . 梯度下降迭代是这样的：

y_{n e w} = y_{o l d} - γ \nabla | | F | |^{2}

$y_{new}=y_{old}-\gamma∇||F||^2$ 在哪里

\nabla | | F | |^{2} = 2 (\nabla F)^{T} F

$∇||F||^2=2(∇F)^TF$ 和

\nabla F_{i j} = 2 A_{i j} y_{j}

$∇F_{ij}=2A_{ij}y_j$ 和

γ

$\gamma$ 是一个任意（通常很小）的正步长。恢复

x

$x$ 通过平方值

y

$y$ ，它总是非负的。有多种复杂的方法

γ

$\gamma$ 提高收敛性的每一步。无论您做什么，您很可能都必须尝试几个（或多个）随机起点来找到最佳解决方案。

其它你可能感兴趣的问题

上一篇寻找关于创建最大熵分类器的可理解讨论下一篇不合格双线性有限元