Halton序列与Sobol'序列?

机器算法验证 采样 小样本 准蒙特卡罗
2022-03-01 10:55:55

从上一个问题的答案中我被引导到 Halton 序列,用于创建一组相当均匀地覆盖均匀样本空间的向量。但是维基百科页面提到,在系列的早期,尤其是较高的素数通常是高度相关的。对于具有相对较短样本量的任何一对高素数似乎都是这种情况 - 即使变量不相关,样本空间也不是均匀采样的,而是在整个空间中存在高样本密度的对角带.

因为我使用长度为 6 或更长的向量,我将不可避免地不得不使用一些素数,这是一个问题(尽管没有上面的例子那么糟糕),并且一些变量对将被非均匀采样他们的样机。在我看来,使用 Sobol' 序列生成一个相似的集合(仅从图表来看)可以在成对的变量之间生成样本,这些变量分布更加均匀,即使对于相对少量的样本也是如此。这似乎更有用,所以我想知道什么时候 Halton 序列会更有益?还是只是 Halton 序列更容易计算?

注意:也欢迎讨论其他多维低差异序列。

1个回答

是的,Halton 更容易计算,但它有你提到的问题。Halton 可以通过跳跃式 Halton 方法进行改进,但不会比 Sobol 更好。对于高维度(如d>10)和中等数量(如N大约 500)所有方法都会遇到问题,例如 Sobol 中的一些 2D 投影会看起来很奇怪,显示出强烈的图案,不是对角线,而是更像棋盘!一种改进方法是随机化,例如所谓的帐篷变换。