我想开发一个测试来确定我的数据集中哪些变量的变化高于“平均变异性”。
从那以后我一直在努力解决这个问题,我也徒劳地试图在其他论坛上寻求帮助。
我有来自生物实验的数据,看起来像这样:
v1 2 1.8 1.5 1.9 2.1 1.78 1.95 2.0 2.1
v2 2 100 -5.2
v3 1 -1.3 -2 2.3
v4 1 1.5 1.6 1.9 2.1 2.0 2.4 -1.1 2.3 1.5 1.6 1.9 1.8 1.6
这些代表基因表达。现在,我希望每个变量(基因)的所有值都或多或少相似,因为这些值是同一基因的重复测量值。
像 v2 这样具有如此巨大差异的变量没有意义,因为重复测量应该给出一致的值。因此,它必须来自方法错误,并且必须丢弃变量(基因)。
我在 R 中寻找一种方法(可能是统计测试),它可以识别我的样本中的“平均变异性”并报告我哪些变量(基因)的变异性显着更大。这意味着对于这些基因,我的数据不足以估计表达,我必须丢弃它们。
我非常感谢我可以用于我的目的的任何测试建议/链接/建议/方法。