对于我感兴趣的疾病,有五六篇已发表的研究表明基因表达的变化与疾病的存在有关。然而,所有这些诊断性生物标志物研究都是在少数病例 (15-30) 和对照 (15-30) 中进行的,它们的潜在生物标志物列表之间的重叠很小。使用临床相关标准定义病例和对照。
我们最近完成了一项涉及 80 个病例和 80 个对照的相对较大的多机构研究,以对此进行调查。所有临床标本在其中一个机构作为批次一起处理。对我们数据的分析表明,基因表达与疾病的存在没有关联。使用与本研究使用相同基因表达测量技术的已发表研究之一的数据,根据limma R 软件包,基于适度的 t 统计数据使用SSPA R 软件包计算效果大小,本研究的功效约为 92 α = 0.10 时的 %。
我们进行的分析是:
基于各种距离测量的无监督层次聚类(主观评价)
主成分分析;传统和矩阵图(主观评价)
用于基因差异表达的各种两组测试(针对错误发现调整的 P 值的显着性阈值为 0.05)
使用线性核支持向量机 (SVM) 和最高得分对 (TSP) 方法进行留一法和蒙特卡罗交叉验证的分类/预测分析;对于 SVM,变量选择基于差异表达测量;TSP 不需要差异表达(这些分析的准确率在 45%-55% 范围内)
在使用不同技术(逆转录-PCR而不是杂交微阵列)量化基因表达后,确认某些基因不存在差异表达,这些基因在先前的研究中被确定为推定的疾病标志物
这些是否足以对我们研究的负面发现充满信心,即基因表达测量不能用于疾病诊断?我应该对表达数据集进行任何其他类型的主观或客观评估吗?
我理解此类结论的常见警告。例如,可能存在疾病标志物可能存在的病例亚组,或者测量技术的敏感性或特异性可能不足以获取某些真正的标志物基因。
谢谢你。