根据递减性对随机分布的变量进行排名

机器算法验证 时间序列 正态分布 排行
2022-04-13 06:45:15

对于我正在进行的一些研究,我遇到了以下问题,我必须反复解决:

我的数据由观察序列组成,每个都有不同的正态分布误差。序列的长度是可变的,范围从 5 到 44 个观察值。{O1,O2,,On}

我需要一个排名系统来表达给定的观察序列减少了多少


到目前为止,这是我想出的:

由于一切都是正态分布的,因此很容易通过蒙特卡洛计算所以我解决这个问题的第一个天真的方法是尝试这两个分数。P(O1>>On)i=1n1P(Oi>Oi+1)

这种方法存在问题。在我的数据中,观察结果可能对应于指数递减的数量,或者遵循幂律。在这些渐近收敛的情况下,对于较大的 ,这些分数可能非常低。更重要的是,具有宽误差线的短序列很容易获得更高的分数。n

所以一个好的排序系统应该惩罚短的、模棱两可的序列并原谅长的、渐近收敛的序列。

考虑模棱两可的情况,可以证明如果所有观察都是独立同分布的,那么无论分布如何:

  • P(O1>O2>>On)=1n!
  • i=1n1P(Oi>Oi+1)=12n1

从这些观察中,我受到启发,得出以下排名:

  • P(O1>>On)×n!
  • i=1n1P(Oi>Oi+1)×2n1

我不能说这些排名的统计特性,因为它们是我自己的发明,我找不到任何关于这个问题的论文。另外,我还没有实现任何东西,因为我最近才遇到这个问题。我将根据我的发展更新这个问题。

欢迎提出意见和批评!提前谢谢大家!

1个回答

而不是近似一个非常小的概率,然后用一个巨大的东西重新缩放它(比如)你会更好地计算整数值统计信息,例如值的计数,以便这将更有效地使用您执行的任何 MonteCarlo 运行。44!2.7×1054iOi>Oi+1

数学家研究了很多的一个想法是反转的数量, where对于均匀随机排列,反转次数是独立离散均匀分布的总和i<jOi>Oj

i=1nU[{0,1,...,i1}]

并且作为这是渐近正态的,均值和标准差n(n2)/2(2n3+3n25n)/72=n3/2/6+O(n).

我不知道具有精确/至少的排列数量的封闭形式表达式,但是对于比您使用,存在足够快的递归。的排列数,恰好有次反转。然后ninI(n,i)ni

I(n,i)=j=0i1I(n1,ij)

通过以上面最后一个均匀随机变量为条件。