协方差可以从均值和方差中得出吗?

机器算法验证 标准差 意思是 协方差矩阵 治疗效果
2022-04-10 13:56:04

在治疗研究中,通常会报告来自同一受试者的多个结果测量值。对这些结果的治疗效果通常是相关的,因此在对数据进行建模时应考虑到这一点。然而,论文只公布干预前后的均值和标准差。因此,例如给出三个测试的报告:

> data.frame(mean.pre=c(1,5,100), sd.pre=c(0.2, 1, 10), mean.post=c(3, 2, 80), sd.post=c(0.3, 0.9, 11), rownames=c('test1','test2','test3'))
#       mean.pre sd.pre mean.post sd.post
# test1        1    0.2         3     0.3
# test2        5    1.0         2     0.9
# test3      100   10.0        80    11.0

...是否可以计算 、 和 之间的标准化均值差的 3 x 3方差d = (mean.post - mean.pre)/sd.pre矩阵test1test2test3

额外信息:有时sd(mean.post-mean.pre)可以通过 t 统计量和 p 值获得变化的标准偏差,有时cor(mean.pre, mean.post)也可以知道相关性。这有什么补充吗?

如果以上不足以计算协方差,我们至少可以对给定这些数据的可能协方差设置一个界限吗?

1个回答

您可以获得的最佳界限是由于 Cauchy-Schwarz 不等式的变体:

|Cov(X,Y)|Var(X)Var(Y)

这当然非常广泛,因为协方差可以是负数,但右手边总是正数。它确保协方差矩阵是半正定的。恐怕奖金信息并没有太大改善,因为现在你有一个 -协方差矩阵,其中你有对角线块已知但在另一边现在可以选择 4 个未知协方差只要整个协方差矩阵保持半正定,任意。(我会想一个证据。)2×2XY4×42×2

我建议问问作者。如果他们不能回答,无论如何他们发表了糟糕的科学,你甚至可以丢弃均值和标准差。