假设我们有一群患者。对于每位患者,我们测量 1000 个特征并观察他们是否患有 10 种疾病中的任何一种。我们希望确定哪些特征(如果有)在预测每种疾病方面具有重要意义。
由于存在多个假设(1000 个特征),我们需要纠正我们的-价值观。例如,我们可能会关注错误发现率并应用Benjamini-Hochberg 过程
我的问题是:我们是否需要将其视为单个多假设问题(1000 个特征10 种疾病 = 10,000 个假设),还是我们可以将其视为 10 个单独的问题(每个问题有 1000 个假设)?我当然更喜欢后者,因为-值校正将抑制更少的项。
很明显,要计算全族错误率,我们需要结合所有假设。我希望 FDR 的行为可能有所不同,并允许我独立分析每种疾病。
更广泛地说,如果这种通用方法偏离基础,我将不胜感激任何指向不同统计工具的指针。
更新:
我在下面将 Michael Lew 的深思熟虑的回答视为正确的,但随后我偶然发现了一个(统计上)更强大的处理 FDR 的工具。这似乎与我的问题非常相关。任何对此问题感兴趣的人都可能会发现这些论文很有帮助: