我当前的数据集包含三个条件,我们测量了每个条件下 10,000 个基因的活性水平。复制 8 次。
使用 10,000 个线性模型,我们确定了每对条件(即三个对比中的每一个)具有显着不同活性水平的基因数量。这是此类微阵列数据的标准程序。
我们发现:
- 2000 个基因在 A 和 B 之间具有显着不同的活性水平
- 1500 个基因在 A 和 C 之间具有显着不同的活性水平
- 100 个基因在 B 和 C 之间具有显着不同的活性水平
这表明条件 B 和 C 彼此之间比 C 更相似。PCA 表明相同的结果。我们有什么方法可以量化“条件 B 和 C 彼此之间比 C 更相似的程度(即在其上放置 p 值?)
感谢您的帮助,如果这个问题微不足道,我们深表歉意。
亲切的问候,