有多少数据点可以拟合前高斯分布?

机器算法验证 分布 曲线拟合
2022-04-05 06:59:17

我想拟合一个前高斯分布(它有三个参数:μ,σ, 和ν) 到反应时间数据。

至少需要多少个数据点才能合理地拟合这个分布?

我知道这个问题的答案取决于许多因素(例如,有多少数据实际上偏离了理论分布)并且通常“越多越好”。无论如何,是否有任何经验法则或出版物可以指出我所需的最少数据点?

2个回答

如果我没记错的话,随着样本量的减少,mu 会表现出积极的偏见,而 tau 会表现出消极的偏见。Sigma 将根据其他参数的真实值表现出正偏差或负偏差。这篇论文比较了两种拟合前高斯的方法,从图中我可能会避免低于 40 个观察值。

由于参数是使用最大似然法估计的,因此您有

n(θ^θ)N(0,Iθ1),

在哪里IθFisher 信息矩阵,并且θ是相关参数的向量。因此

Var(θ^θ)1/nIθ1

如果你计算过Iθ1你怀疑 true 的近似值θ,这会给你一个近似方差的概念。然后,您可以计算出最少的点数。这不是完美的解决方案,但根据经验,它可能会起作用。