机器算法验证 - 双变量正态的条件抽样 - 吾爱随笔录

双变量正态的条件抽样

机器算法验证可能性正态分布条件概率蒙特卡洛

2022-04-01 02:06:54

我想在一个条件下从二元正态分布生成随机样本。第一个正常变量是，第二个。条件是，其中是一个常数，而，其中、和是常数。和是独立的。因此，条件是在以垂直线 $\varepsilon_1$ $\varepsilon_2$ $\varepsilon_1>T_1$ $T_1$ $a \varepsilon_1 + b\varepsilon_2 <T_2$ $a$ $b$ $T_1$ $\varepsilon_1$ $\varepsilon_2$ $T_1$ 和一条倾斜的线。有没有办法做到这一点而不产生许多随机样本并将这些样本扔到条件区域之外？原因是条件区域中的概率可能非常小，因此丢弃样本不是一种选择。

3个回答

如果您有另一个界限（例如），您可以均匀采样，然后使用二元正态密度对样本进行加权。你会有零拒绝。也许在您的应用程序中强加这样的限制不是太不合理？ $\epsilon_2 > T3$

可能更好：

您会找到两个线性条件之间的交集。然后，您从指数或截断法线沿两个条件之一（例如沿）生成 rv然后，如果两个线性条件之间的角度是锐角，则和）。如果它是钝的，则从截断的法线或指数不涉及拒绝，并且您不需要限制区域，但您会获得加权样本。 $x_1$ $\epsilon_1 = T_1$ $\epsilon_1 = T_1$ $x_1$ $a\epsilon_1 + b\epsilon_2 = T_2$ $\epsilon_1 = T_1$

我使用了吉布斯抽样方法。这样，只有吉布斯采样的开始被丢弃（稳定期）。因此，腰部样本的数量不会随着所需样本的数量而增加。

在观察的条件下，是从正态分布中采样的，有界。 $\varepsilon_1$ $\varepsilon_2$ $b\varepsilon_2< Th_2 - a\varepsilon_1$
以观察为条件，。 $\varepsilon_2$ $Th_1<\varepsilon_1< (Th_2 - b\varepsilon_2)/a$

下面的代码设置，。 $a=\sqrt{t1}$ $b=\sqrt{t2-t1}$

    nScens = 1E8;
    epsilon1 = randn(nScens, 1);
    epsilon2 = randn(nScens, 1);
    Th1 = -3;
    Th2 = -2.9;
    t1 = 700;
    t2 = 707;

    ind = epsilon1 > Th1 & ( epsilon1*sqrt(t1) + epsilon2*sqrt(t2-t1))/sqrt(t2) < Th2;
    sum(ind)

    figure(1)
    subplot(121)
    scatter(epsilon1(ind), epsilon2(ind),'.' )
    axis([ -3 -2.5 -5 1])
    subplot(122)        
    smoothhist2D([epsilon1(ind), epsilon2(ind)],5, [100,100],[], 'contour')
    axis([ -3 -2.5 -5 1])

    %      gibbs sampler
    nGibbs = 75000;
    epsilon1Gibbs = 0;
    for i=1:nGibbs
        epsilon2Gibbs = norminv( normcdf( (Th2*sqrt(t2) - epsilon1Gibbs*sqrt(t1) )/sqrt(t2-t1) )*rand );
        p = ( -normcdf(Th1) + normcdf( (Th2*sqrt(t2) - epsilon2Gibbs*sqrt(t2-t1) )/sqrt(t1) ) )*rand + normcdf(Th1);
        epsilon1Gibbs = norminv( p );
        epsilonGibbs(i, :) = [epsilon1Gibbs epsilon2Gibbs];
    end
    indGibbs = 2500:nGibbs;
    figure(2)
    subplot(121)
    scatter(epsilonGibbs(indGibbs,1), epsilonGibbs(indGibbs,2),'.'  )
    axis([ -3 -2.5 -5 1])
    subplot(122)        
    smoothhist2D( epsilonGibbs(indGibbs,:) ,5, [100,100],[], 'contour')
    axis([ -3 -2.5 -5 1])

蛮力采样：

吉布斯抽样：

一种会大幅降低拒绝率的简单方法是将坐标旋转到使得线变为垂直 ( ,说）。然后从截断的法线生成。然后生成一个独立的并拒绝那些不符合其他（旋转）条件的对，并将接受的对旋转回来。 $(\epsilon_1,\epsilon_2)$ $(X_1,X_2)$ $aε_1+bε_2=T_2$ $cX_1=\tau_2$ $cX_1<\tau_2$ $X_2$

拒绝率会很高（例如，它可能会超过 50%），但可能根本不会是极端的，因为如果你一开始没有从极尾截断法线生成，那肯定会如此。

其它你可能感兴趣的问题

上一篇使用 t 检验比较算法的性能下一篇调查数据的卡方检验