对于我正在进行的一些研究,我遇到了以下问题,我必须反复解决:
我的数据由观察序列组成,每个都有不同的正态分布误差。序列的长度是可变的,范围从 5 到 44 个观察值。
我需要一个排名系统来表达给定的观察序列减少了多少。
到目前为止,这是我想出的:
由于一切都是正态分布的,因此很容易通过蒙特卡洛计算或。所以我解决这个问题的第一个天真的方法是尝试这两个分数。
这种方法存在问题。在我的数据中,观察结果可能对应于指数递减的数量,或者遵循幂律。在这些渐近收敛的情况下,对于较大的 ,这些分数可能非常低。更重要的是,具有宽误差线的短序列很容易获得更高的分数。
所以一个好的排序系统应该惩罚短的、模棱两可的序列并原谅长的、渐近收敛的序列。
考虑模棱两可的情况,可以证明如果所有观察都是独立同分布的,那么无论分布如何:
- 和
从这些观察中,我受到启发,得出以下排名:
我不能说这些排名的统计特性,因为它们是我自己的发明,我找不到任何关于这个问题的论文。另外,我还没有实现任何东西,因为我最近才遇到这个问题。我将根据我的发展更新这个问题。
欢迎提出意见和批评!提前谢谢大家!