如何解释箱线图?

机器算法验证 解释 箱形图
2022-03-29 04:34:48

我有一些数据,其中有 5 个分类解释变量 ( concern, breath, weath, sleep, act) 和 1 个连续响应变量 ( tto)。此外,每个分类解释变量分为 5 个级别,显示一个人对它的感觉有多强烈。级别 1 和级别 5 分别显示完美和最差状态。

我被建议创建一个箱线图来查看解释变量和响应变量之间的关系。情节如下。但是,我不知道如何阅读箱线图。谁能帮我解释一下。

在此处输入图像描述

2个回答

箱线图(或者箱须图)的解释在于理解它提供了五个数字摘要的图形表示,即最小值、第一四分位数、中位数、第三四分位数和最大值。该框包含 50% 的观察值。胡须的末端(从盒子顶部和底部发出的垂直线)通常显示最小值和最大值所在的位置。但是,在可能存在异常值的情况下(有时根据 1.5×四分位距)点被添加,就像你的数字一样。

查看特定类别数据的直方图或密度图可能对您有用,因为这可以帮助您理解箱线图的含义。

@Glen_b 正确地表明左偏是明显的,并且第 5 级感觉强度的集中趋势低于其他水平。然而,很难看出这种差异是否具有统计学意义。

这是那里的基本摘要:

  1. 所有分布都出现左偏,“卡”在 1.0 的上限,许多低“异常值”向底部拖尾。
  2. 每个情节中的第 5 个类别似乎比其他类别低。有时第四类也很低。
  3. 所有 5 个变量(关注、呼吸、天气、睡眠、行为)似乎具有大致相似的模式。