如何从中位数和 IQR 计算第四个四分位数?

机器算法验证 数理统计 分位数 中位数 四分位数
2022-04-01 17:42:30

如何从中位数和 IQR 计算第四个四分位数。在一篇科学文章中,我有以下价值观:

  • 中位数为 2.8 ng/ml 双酚 A 和
  • 四分位距,他们写的是1.5-5.6。

我能得出这样的结论吗

  • 第一个四分位数是 1.5
  • 第二个四分位数 2.8
  • 和第三个四分位数 5.6 ?

如果可以,我理解,但我需要重新计算才能获得四个四分位数。你能帮助我吗?

3个回答

注意:在下面的答案中,我假设您只知道您提到的分位数,而您对分布一无所知,例如,您不知道分布是否对称或其 pdf 或其(集中)矩是什么。


如果您只有中位数和 IQR,则无法计算第四个四分位数。

让我们看看以下定义:

中位数 = 第二四分位数。

IQR = 第三四分位数第一个四分位数。

第 4 个四分位数不在这两个方程中。因此,不可能用给定的信息来计算它。


这是一个例子:

   x <- c(1,2,3,4,5,6,7,8,9,10)
   y <- c(1,2,3,4,5,6,7,8,9,20)

summary(x)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   1.00    3.25    5.50    5.50    7.75   10.00 

summary(y)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   1.00    3.25    5.50    6.50    7.75   20.00 

第一个四分位数适用于“x”和“y”3,25。两者的中位数也是 5.5。两者的第三个四分位数均为 7.75,IQR 为 7.75 3.25 = 4.5。但是,第 4 个四分位数(也是最大值)不同,即 10 和 20。


您还可以查看 x 和 y 的箱线图,您会看到第一个四分位数、第二个四分位数(中位数)和第三个四分位数相等。因此,您无法就数据点的其余分布得出任何结论。

df <- data.frame(x,y)
p <- ggplot(stack(df), aes(x = ind, y = values)) + geom_boxplot()
p

在此处输入图像描述

@Ferdi 是正确的,但我认为你问错了问题。我认为您很困惑,因为“四分位数”似乎意味着“某物的 4”。确实有4组。但这意味着有 3 个部门,至少在我读过的内容中,根本没有使用第 4 个四分位数(作为一个数字)这个词。如果您确实将第 4 个四分位数计算为数字,那么您还需要第 0 个四分位数,这将是最小值。但我认为这不是你想要的。

如果不清楚,请将矩形切割成 4 个矩形。你需要三个切口来制作四个矩形。

如果我错误地指责您感到困惑,我深表歉意,但我不止一次看到这种困惑。

第一个四分位数有 25% 的数据低于它,第二个四分位数 = 中位数有 50% 的数据低于它,第三个四分位数有 75% 的数据低于它,25% 的数据高于它。IQR = 第三四分位数 - 第一个四分位数。第四个四分位数将是最大值,您无法从中位数和 IQR 中获得。IQR 和中位数很少告诉你分布的形状。如果您知道分布的形状,您也许可以做出估计,但对于许多分布,答案将是无穷大的。我怀疑第三个四分位数是你真正想要的。如果你有 IQR 和中位数并且知道分布的形状您可能能够估计第三个四分位数:例如对称分布的中位数加上 IQR 的一半。然而,许多分布不是对称的。此外,如果您得到的是半四分位距而不是 IQR,请小心。