最低数量 统计分布拟合所需的观测值!

机器算法验证 分布 估计
2022-03-16 17:26:52

我有一个关于分布拟合的概念性(但有点模糊)问题。

需要多少个观察值才能最适合给定数据的任何统计分布。就像我正在处理损失数据一样,在一种情况下,我只有三个观察结果仍然可以拟合正态分布,实际上我认为这是荒谬的。再多一份数据,情况可能会发生变化。

因此,为了获得合理稳定的分布拟合,是否存在最小观察次数的经验法则?

1个回答

好吧,在丢失数据的特殊情况下,我认为最合适的是第二个来源,但我也给你一些其他的:

t1 http://imash.leeds.ac.uk/dicode/wp4/Stats2-Forum/view_topic.php?id=10079

t2 http://www.mathwave.com/articles/distribution-fitting-preliminary.html

pdf: http ://www.vanbelle.org/chapters/webchapter2.pdf

并查看这个相关问题: 有多少数据点适合前高斯分布?

我可以从我的研究中告诉你,如果股票出现亏损回报,你需要相当多的值来正确估计适当的分布。损失分布通常是尖峰和偏斜的,因此可以拒绝正态性假设。特别是如果你对风险管理感兴趣,你会关注尾部。因此,根据我的知识,您至少需要 200 次观察才能大致了解极值的分布。如果您真的想为风险管理做极值理论,您将不得不考虑更多的观察结果,因为这些值大多以很小的概率出现,所以在这种情况下,假设 5% 你只有 0,05*200 =10 个极值。

请注意,您说的是“稳定分布”。在这种情况下这并不是很方便,因为稳定分布是一个不同的主题,例如柯西分布是稳定的。我认为更合适的说法是,估计量应该有一个小的方差,所以如果你对另一个样本进行重新估计,它们不会有太大的变化。这将引出另一个统计话题。