审查论文中的统计数据

机器算法验证 参考 裁判
2022-02-09 12:03:47

对于我们中的一些人来说,审阅论文是工作的一部分。在审阅统计方法论文时,我认为来自其他学科领域的建议相当有用,即计算机科学数学

这个问题涉及审查更多应用的统计论文。我的意思是,该论文被提交给非统计/数学期刊,而统计数据只是在“方法”部分中提到。

一些特别的问题:

  1. 我们应该付出多少努力来了解应用领域?
  2. 我应该花多少时间在报告上?
  3. 你在看数字/表格时有多挑剔。
  4. 您如何处理无法获得的数据。
  5. 您是否尝试重新运行所使用的分析。
  6. 您一年内最多审阅多少篇论文?

有错过任何问题吗?随意编辑或添加评论。

编辑

我是作为一名统计学家来评论生物学论文的,但我对任何非数学学科的统计评论都很感兴趣。


我不确定这是否应该是CW。一方面它有点开放,但另一方面我可以看到自己接受了一个答案。此外,答案可能会相当长。

3个回答

我不确定您指的是哪个科学领域(例如,如果处理生物学与物理学,我相信答案会非常不同......)

无论如何,作为生物学家,我会从“生物学”的角度来回答:

我们应该付出多少努力来了解应用领域?

如果我不太熟悉,我倾向于至少阅读同一作者以前的论文,并寻找一些关于该主题的评论。在处理我不知道的新技术时尤其如此,因为我需要了解他们是否进行了所有适当的控制等。

我应该花多少时间在报告上?

根据需要(好吧,愚蠢的答案,我知道!:P)一般来说,我不希望有人仅仅因为他/她还有其他事情要做,就审查我的论文来做一个近似的工作,所以我尽量不要自己做.

你在看数字/表格时有多挑剔。

相当挑剔。浏览论文时,您首先看到的是图形。它们需要保持一致(例如,轴上的正确标题、正确的图例等)。有时,当我认为使用的图不是最好的时,我建议使用另一种图来显示数据。这在生物学中经常发生,这是一个以“条形图 +/- SEM”类型的图表为主的领域。我对“材料和方法”部分也很挑剔:对一个天生错误的生物模型进行完美的统计分析是完全没有用的。

您如何处理无法获得的数据。

我猜你只是相信作者。在生物学的许多情况下,您无能为力,尤其是在处理成像或动物行为等类似问题时。除非您希望人们发布大量图像、视频等(您很可能无论如何都不会经历这些),但这可能非常不切实际。如果您认为这些数据确实有必要,请要求作者提供它们作为补充数据/数字。

您是否尝试重新运行所使用的分析。

只有当我对作者得出的结论有严重怀疑时。在生物学中,什么是(或不)“统计显着”和什么是“生物学显着”之间通常存在差异。我更喜欢具有良好生物学推理的更薄的统计分析,而不是相反。但同样,万一我要审查一篇生物统计学论文(啊哈,那会很有趣!!!)我可能会更关注统计数据而不是那里的生物学。

这解决了新问题 #6:“您一年内最多可以审阅多少篇论文?” 我作为几个编辑委员会的成员作出回应。长期存在的问题是找到足够的审稿人。根据期刊的不同,每篇提交的论文都需要一到三个同行评审员,通常是三个。如果期刊有x% 接受率,那么每篇被接受论文的平均评论数显然约为3/(x/100). 例如,如果接受率为 33%,则编辑需要为每篇发表的论文获得 9​​ 篇评论。如果您作为作者认真对待这一点,那么您应该尝试为您发表的每篇论文提供 9 篇评论(或者您的目标期刊的评论数量)!

我之所以写这篇文章是因为与此网站上的投票非常相似:为了让您获得r, 其他人必须支持某些组合r/10你的答案和r/5你的问题。因此,如果您正在减轻体重,则至少应检查您的个人资料 r/10赞成票。许多但肯定不是本网站最活跃的所有成员都是这种情况。需要考虑的事情...记得投票!

我的 POV 将审查一篇心理学论文或预测其统计优点。我将主要支持 Nico 的非常好的评论。

我们应该付出多少努力来了解应用领域?

实际上,相当多。在不了解该领域的情况下,我不相信自己会评论最基本的统计问题。幸运的是,这在许多心理学分支中通常并不难。

我应该花多少时间在报告上?

我会冒险并陈述一个具体的时间:我会花两到八个小时进行审查,有时甚至更多。如果我发现我在一篇论文上花了超过一天的时间,那可能意味着我真的没有资格看懂它,所以我会建议期刊找其他人(并尝试推荐一些人)。

你在看数字/表格时有多挑剔。

确实很挑剔。这些数字将是人们对一篇论文的记忆,以及在没有太多背景的情况下最终在演讲中得到的结果,所以这些确实需要做好。

您如何处理无法获得的数据。

在心理学中,数据通常不共享——通过 MRI 测量 50 人非常昂贵,作者希望将这些数据用于进一步的论文,所以我有点理解他们不愿意只给出数据。因此,任何共享数据的人都会在我的书中获得丰厚的奖励,但不共享是可以理解的。

在预测中,许多数据集都是公开可用的。在这种情况下,我通常建议作者分享他们的代码(我自己也这样做)。

您是否尝试重新运行所使用的分析。

没有数据,人们只能从中学到很多东西。如果论文的结果有什么令人惊讶的地方,我会使用模拟数据;否则,人们通常可以在没有数据的情况下分辨出适当的方法和不适当的方法(一旦了解了该领域,请参见上文)。

您一年内最多审阅多少篇论文?

上面 whuber 的观点几乎没有什么可补充的 - 假设我(共同)提交的每篇平均有n位共同作者的论文都得到 3 条评论,一个人真正应该针对自己提交的每篇论文至少审查 3/( n+1 ) 篇论文(计算提交而不是可能被拒绝和重新提交的自己的论文)。当然,提交的数量以及合著者的数量因学科而异。