报告描述性统计的意义何在?

机器算法验证 描述性统计 报告
2022-02-08 00:38:52

我刚刚使用逻辑回归对我的数据进行了分析,但是我还需要在报告中包含描述性统计部分。老实说,我没有看到这一点,我希望有人能够解释为什么它是必要的。

例如,如果我绘制一个独立连续变量的直方图,它显示正态性或显示偏度,这将如何为报告增加任何价值?

我的数据由一个因变量对工作的真假组成,自变量是期中成绩、期末考试成绩、男性或女性。

4个回答

在我的领域,报告的描述部分非常重要,因为它为结果的普遍性设置了背景。例如,研究人员希望从医院的样本中确定摩托车事故后创伤性脑损伤的预测因素。她的因变量是二元的,她有一系列自变量。多变量逻辑回归使她能够得出以下发现:

  • 与使用头盔相比,未使用头盔调整 OR = 4.5 (95% CI 3.6, 5.5)。
  • 所有其他变量均未包含在最终模型中。

需要明确的是,建模没有问题。我们专注于描述性统计可以增加的价值。

如果没有描述性统计数据,读者就无法正确看待这些发现。为什么?让我向您展示描述性统计数据:

age, years, mean (SD)                  54 (2)
males, freq (%)                       490 (98)
blood alcohol level, %, mean (SD)    0.10 (0.01)
...

从上面可以看出,她的样本由年龄较大、醉酒的男性组成。有了这些信息,读者就可以说出这些结果可以说明年轻男性受伤或未醉酒的骑手或女性骑手受伤的情况(如果有的话)。

请不要忽略描述性统计数据。

提供描述性统计数据的目的是描述您的样本特征,以便其他中心或国家的人们可以评估您的结果是否适用于他们的情况。因此,在您的情况下,将性别、成绩等制成表格将是对逻辑回归的有益补充。这不是让人们检查您的假设,尽管他们也可能会尝试这样做。

============== 编辑以提供一些健康指南的链接

在我熟悉的健康领域,有特定的报告指南。这些已在EQUATOR 网络中收集在一起,应查阅这些信息以获取最新的详细信息。

例如,我们可以采用相关指南为 CONSORT 的临床试验。在概述此处和其他地方可用指南的文件中,我们在表 1 建议 15“显示每组基线人口统计和临床特征的表格”中阅读。

其他研究类型也有类似的建议。

另一件事是显示您的变量的表现如何。例如,如果您的变量之一是薪水,并且您恰好采访了一位亿万富翁,那么当您将他的薪水输入逻辑回归时,它将支配其他所有内容,因此您可能会学会忽略薪水,而不管它可能包含多少实际信息。

有些方法比其他方法对偏度和极值更敏感,而逻辑回归则比较敏感。当然,最终的证明在布丁中,您可以将获得的结果与原始数据进行比较,或者将每个特征转换为正态性。

描述性部分有助于了解读者您的数据集。在应用经济学中,通常强烈建议使用它,因为它可能会显示分析中的第一个潜在缺陷。

您可能会使用来自不同来源的数据来夸大您的描述。

1张桌子应该足够了。您附加的那个不是很直观。