使用变异系数来总结一组参数分布的替代方法?

机器算法验证 分布 数据可视化 描述性统计 增删改查 l 时刻
2022-03-24 18:28:45

背景

我有一个包含 17 个参数的模型,我目前使用变异系数 ( ) 来总结每个参数的先验分布和后验分布。CV=σ/μ

所有参数均 > 0。我还想以归一化的比例总结这些 pdf(在这种情况下,标准偏差按均值归一化),以便可以将它们相互比较,并与类似的相邻图中显示的其他统计数据进行比较(敏感性,解释方差)。我将分别包含每个参数的密度图,但我想在这里总结一下。

然而,CV 对的敏感性会导致以下混淆,尽管在文本中很容易解释,但最好避免。μ

  1. 一个参数的后验 CV 大于先验,因为均值下降幅度大于方差(O图中的参数)。
  2. 其中一个参数 ( N) 以温度为单位。它的 95% 先前 CI 为 (8,12 摄氏度 281-285K);当我以仅为正值定义的开尔文单位呈现数据时,CV 小于 1%,如果呈现为 C,CV 更接近 40%。对我来说,这些简历似乎都没有提供 CI 的直观表示。

问题

有没有更好的方法来呈现这些信息,无论是作为简历还是其他统计数据?

数字

例如,这是我计划呈现的情节类型,后验 CV 为黑色,之前的 CV 为灰色。对于比例,参数的 CVO为 1.6。

替代文字

2个回答

在我看来,简历在这里不合适。我认为最好将位置变化与分散变化分开。此外,对于大多数参数值,您在对该问题的评论中提到的分布是偏斜的(积极的,除了 beta 分布)。这让我质疑标准偏差是否是衡量离散度的最佳选择;也许四分位距(IQR)可能更好,或者可能是中位数绝对偏差?同样,我可能会将中位数或众数视为位置度量,而不是平均值。在实践中,选择可能取决于计算的难易程度以及应用领域、模型的细节......

假设您选择使用 IQR 和模式。您可以使用后验与先验 IQR 的比率来总结分散的变化,可能以对数标度绘制,因为这通常适用于比率。您可以使用后验和先验模式之间的差异与先验 IQR 或后验 IQR 或后验和先验 IQR 的几何平均值的比率来总结位置变化。

这些只是想到的一些快速想法。我不能声称他们有任何强大的基础,甚至对他们有任何强烈的个人依恋。

一些与 CV 具有相同“风味”的替代品是:

  1. L-变异系数,参见例如 Viglione第二个样本 L 矩代替了样本标准差。
  2. - Winsorized标准差除以修剪均值。您可能希望将其除以以获得跨不同值的一致缩放。我会尝试γγ12γγγ=0.2
  3. 样本数的平方根乘以中位数标准误差的 McKean-Schrader 估计值除以样本中位数。