错误发现应该在数据采集级别进行控制,还是应该在数据解释级别进行?
我有一个实验,其中使用微阵列来量化两组生物组织(组大小为 75 和 76)中大约 30,000 个基因(变量)的表达。对原始阵列数据进行预处理,以去除无法检测到表达水平的背景信号和基因,并对阵列中的值进行标准化。然后使用 Mann-Whitney U 检验检查最终数据,以比较两组之间的基因表达以识别差异表达的基因,并通过Benjamini-Hochberg程序控制错误发现率 (FDR) 。在 FDR <5% 时,没有基因被鉴定为差异表达,我正式得出结论,“两种组织之间没有基因的差异表达”。
现在,假设有人只对一个特定基因的表达感兴趣。使用我预处理的基因表达数据集和 U 检验,他们比较了两组仅此基因的表达,并注意到 P 值 <0.05,这是我研究领域中常用的显着性阈值。由于这不涉及多次测试,因此没有错误发现控制。这位观察者能否正式得出结论,“基因在两种组织之间存在差异表达”,这与我的结论相矛盾?
或者观察者是否应该应用错误发现控制,因为这种控制必须应用于数据采集级别(据此,收集了多个变量的数据)而不是数据解释级别(据此,只有一个变量的数据)变量进行了分析)?