我有几个服务器响应延迟的测试结果。根据我们的理论分析,延迟分布(响应延迟的概率分布函数)应该具有重尾行为。但是我怎么能证明测试结果确实遵循重尾分布呢?
如何证明实验数据服从重尾分布?
机器算法验证
回归
分布
可能性
正态分布
数理统计
2022-03-03 20:31:38
1个回答
我不确定我是否正确解释了您的问题,所以请告诉我,我可以调整或删除此答案。首先,我们不会证明有关我们数据的事情,我们只是证明某些事情并非不合理。这可以通过多种方式完成,其中之一是通过统计测试。然而,在我看来,如果你有一个预先指定的理论分布,最好的方法就是制作一个qq-plot。大多数人认为 qq-plots 仅用于评估正态性,但您可以根据任何可以指定的理论分布绘制经验分位数。如果你使用 R,car 包有一个增强的函数qq.plot()有很多不错的功能;我喜欢的两个是您可以指定许多不同的理论分布,而不仅仅是高斯分布(例如,您可以指定t一个更肥尾的替代方案),并且它绘制了一个 95% 的置信带。如果您没有特定的理论分布,但只是想看看尾巴是否比正常情况下的预期重,可以在 qq 图上看到,但有时很难识别。我喜欢的一种可能性是制作内核密度图和 qq 图,您可以在其上覆盖一条正态曲线以启动。基本的 R 代码是plot(density(data)). 对于一个数字,您可以计算峰度,看看它是否高于预期。我不知道 R 中峰度的固定函数,您必须使用链接页面上给出的方程式对其进行编码,但这并不难。
其它你可能感兴趣的问题