统计取证:本福德及其他

机器算法验证 荟萃分析 欺诈识别
2022-02-06 17:46:29

有哪些广泛的方法可以检测第三方制作的科学作品中的欺诈、异常、捏造等?(最近Marc Hauser 事件促使我提出这个问题。)通常对于选举和会计欺诈,会引用本福德定律的一些变体。我不确定这如何适用于例如Marc Hauser 案,因为本福德定律要求数字大约是对数一致的。

作为一个具体的例子,假设一篇论文引用了大量统计检验的 p 值。可以将这些转换为对数均匀性,然后应用本福德定律吗?这种方法似乎会有各种各样的问题(例如,一些零假设可能合法地是错误的,统计代码可能会给出仅近似正确的 p 值,测试可能只会给出统一的 p 值渐近地在零下等)

2个回答

好问题!

在科学背景下,存在各种有问题的报告和有问题的行为:

  • 欺诈:我将欺诈定义为作者或分析师故意歪曲结果,并且该歪曲具有足够严重的性质。主要的例子是完全捏造原始数据或汇总统计数据。
  • 错误:数据分析师在数据分析的许多阶段都可能犯错误,从数据输入到数据操作、分析、报告和解释。
  • 不当行为:不当行为有多种形式。一般来说,它可以用一种寻求确认特定立场而不是寻求真相的方向来概括。

不当行为的常见示例包括:

  • 检查一系列可能的因变量并仅报告具有统计意义的变量
  • 没有提到重要的违反假设
  • 执行数据操作和异常值删除程序而不提及它,特别是在这些程序既不合适又纯粹是为了使结果看起来更好的情况下
  • 提出一个模型作为确认,实际上是探索性的
  • 省略与期望论点背道而驰的重要结果
  • 仅根据它使结果看起来更好来选择统计测试
  • 运行一系列 5 或 10 个动力不足的研究,其中只有一个具有统计学意义(可能在 p = .04),然后报告该研究而不提及其他研究

一般来说,我假设无能与所有三种形式的问题行为有关。不了解如何做好科学但又想成功的研究人员将更有动力歪曲他们的结果,并且不太可能尊重道德数据分析的原则。

上述区别对检测有问题的行为有影响。例如,如果您设法辨别出一组报告的结果是错误的,那么仍然需要确定结果是否来自欺诈、错误或不当行为。此外,我认为各种形式的不当行为远比欺诈更为普遍。

关于检测有问题的行为,我认为这主要是一种来自处理数据、处理某个主题以及与研究人员合作的经验的技能. 所有这些经验都增强了您对数据应该是什么样子的期望。因此,与预期的重大偏差开始了寻找解释的过程。研究人员的经验让您了解或多或少常见的不当行为。结合起来,这导致了假设的产生。例如,如果我读了一篇期刊文章,但我对结果感到惊讶,这项研究的动力不足,而写作的性质表明作者正准备提出一个观点,我会产生这样的假设,即结果可能不应该是信任。

其他资源

实际上,本福德定律是一种非常强大的方法。这是因为第一位数字的 Benford 频率分布适用于现实或自然世界中出现的各种数据集。

你是对的,你只能在某些情况下使用本福德定律。你说数据必须有一个统一的日志分布。从技术上讲,这是绝对正确的。但是,您可以用更简单和宽松的方式描述需求。您所需要的只是数据集范围至少跨越一个数量级。比方说从 1 到 9 或 10 到 99 或 100 到 999。如果它超过两个数量级,你就在做生意。而且,本福德定律应该很有帮助。

本福德定律的美妙之处在于它可以帮助您快速缩小调查范围,在海量数据中找到针尖。您寻找异常,其中第一位数字的频率与本福德频率有很大不同。一旦你注意到有两个很多 6,你就可以使用本福德定律只关注 6;但是,您现在将其带到前两位数(60、61、62、63 等...)。现在,也许你发现 63 比 Benford 建议的要多得多(你可以通过计算 Benford 的频率来做到这一点:log(1+1/63),它给你一个接近 0% 的值)。因此,您使用 Benford 到前三位数。当您发现 632(或通过计算 Benford 的频率:log (1+1/632))比预期的要多时,您可能正在做某事。并非所有异常都是欺诈。但,

如果 Marc Hauser 操作的数据集是相关范围足够宽的自然无约束数据,那么本福德定律将是一个非常好的诊断工具。我相信还有其他很好的诊断工具也可以检测出不太可能的模式,并且通过将它们与本福德定律结合起来,您很可能已经有效地调查了马克豪瑟事件(考虑到本福德定律的上述数据要求)。

我在这个简短的演示文稿中更多地解释了本福德定律,您可以在这里看到: http ://www.slideshare.net/gaetanlion/benfords-law-4669483