我有一个具有两个吸收状态的随机过程(实际上是马尔可夫链)。我正在使用差分方程来计算到达任一吸收状态的第一次通过时间。方程中有几个参数。
对于一组参数,经验累积分布函数如下所示:
其概率密度函数只有一个峰值。对于另一组参数,我将拥有:
其 PDF 将是“两个分布”的叠加,即有两个峰值。
我的问题是,是否有“可靠”/“好”的算法/方法来推断分布的数量,每个井(或不太好)分离分布的统计数据?
我有一个具有两个吸收状态的随机过程(实际上是马尔可夫链)。我正在使用差分方程来计算到达任一吸收状态的第一次通过时间。方程中有几个参数。
对于一组参数,经验累积分布函数如下所示:
其概率密度函数只有一个峰值。对于另一组参数,我将拥有:
其 PDF 将是“两个分布”的叠加,即有两个峰值。
我的问题是,是否有“可靠”/“好”的算法/方法来推断分布的数量,每个井(或不太好)分离分布的统计数据?
累积分布函数是概率分布函数的积分(反微分)。换句话说,PDF 是 CDF 的导数。因此,您可以通过计算数据的导数来计算 PDF,例如通过形成一个差商来近似从一组有限的点的导数。
通过对累积分布函数进行差分,可以找到概率密度函数。您正在寻找的是的局部最大值;从您的第二个图中,看起来在处有一个很大的最大值,在处有另一个最大值。您可以直接从 CDF 中将这些视为拐点,其中从凸变为凹。
这是一个双峰分布,每个峰称为一个“模式”。您可以通过在 PDF 中查找局部最大值的数量来可靠地计算模式数量。当然,一些非常小的局部最大值可能只是统计伪影,因此您需要一个排除虚假最大值的标准。
如果您想更多地了解共识时间的统计信息,您可以合理地猜测您的 PDF 格式为
其中是取决于某些参数的单峰分布。然后,您可以尝试找到、和的最佳值。例如,可以是赌徒破产问题的击球时间 PDF,参数代表游戏的公平性和赌徒的初始资本。