假设我们有一种非常有效的执行方式“规范”压缩 vs规范压缩感知。具体来说,“规范”压缩感知是
而范数压缩感知是
我们应该几乎总是使用规范公式吗?是否有任何论文讨论(忽略计算角度)相对于规范压缩感知的好处?
编辑:我们感兴趣的实际应用是关于避免下面公式的过度拟合。例如是一个很长的特征向量(比如长度);但是我们只有数据,即是,而是。我们感兴趣的问题是,范数公式(如果可以实际计算)是否可以比范数公式提供显着优势。
假设我们有一种非常有效的执行方式“规范”压缩 vs规范压缩感知。具体来说,“规范”压缩感知是
而范数压缩感知是
我们应该几乎总是使用规范公式吗?是否有任何论文讨论(忽略计算角度)相对于规范压缩感知的好处?
编辑:我们感兴趣的实际应用是关于避免下面公式的过度拟合。例如是一个很长的特征向量(比如长度);但是我们只有数据,即是,而是。我们感兴趣的问题是,范数公式(如果可以实际计算)是否可以比范数公式提供显着优势。
在压缩感知中,真正的问题是范数(嗯,伪范数)。
伟大的发现之一是使用相同的结果 。
所以我们可以从几何直觉上找到为什么会促进稀疏性,而真正的稀疏成本函数是规范。