关于对立变量法的问题

机器算法验证 期望值
2022-03-31 00:06:08

假设我们要估计一个期望问题E(f(X)), 在哪里X是一个已知分布的随机变量,通过模拟和大数定律估计。在这种情况下,对立方法是一种减少估计量方差的方法。

如果X是带有 cdf 的一维随机变量F, 对偶方法应用如下:

得到一个均匀分布的样本 U[0,1], 然后X1=F1(U) 有 F 作为 cdf,并且Y1=F1(1F(X1))也有 F 作为 cdf 和X1Y1有负相关。然后 E(f(X)) 估计为i=1Nf(Xi)+f(Yi)2N.

以下是我的问题:

  1. 如果X1Y1有负相关,那么为了减少估计量的方差,是否正确f(X1)f(Y1)一定也有负相关吗?条件是什么f这是真的吗?

  2. 如果X是一个多元随机变量,因为它的 cdfF没有分位数逆F^{-1},在一般情况下是否仍然可以应用对立方法?如果考虑特殊情况,其中的组件X是独立的,是否可以应用对立的方法?如果是怎么办?

  3. 我注意到对立也增加了样本,而实际上没有对任何分布进行更多抽样。我记得增加样本量也会减少 LLN 估计量的方差。如果估计量的方差可以通过对立的方法降低,样本量的增加贡献了多少,样本之间引入负相关贡献了多少?如果使用与对偶加倍后的样本大小相同的 iid 样本,哪个样本的方差会更小?

谢谢并恭祝安康!

1个回答
  1. 是的。没有简单的条件。什么时候f是单调的,f(X1)f(Y1)仍将呈负相关。什么时候f不是单调的,所有的赌注都是关闭的。例如,让F是均匀分布在[1,1]然后让f(x)=x2. 然后X1=Y1, 从何而来f(X1)=f(Y1), 暗示f(X1)f(Y1)是完全相关的:你没有得到关于期望的额外信息(X1,Y1)比你从X1独自的。在这种极端情况下使用对立方法的成本是将样本量加倍以实现给定的估计方差。

    非单调问题的一个实际例子f出现在这里

  2. 是的,在某些情况下。对组件使用对立的方法X分别地。如果组件不是强相关或当F是对称的。

  3. 假如f(X1)f(Y1)是负相关的,你用对立的方法得到更小的估计方差。作为一个极端的例子,考虑以下情况F是统一的[1,1]f是身份。然后对于任何单个样本,Y1=X1和他们的意思(X1+Y1)/2=0估计平均值F 正是而两个独立样本的平均值(X1,X2)有一个方差1/6.

这种技术似乎至少在精神上与拉丁超立方体采样有关。