技术变化与真实信号

机器算法验证 r 回归 方差分析
2022-04-09 16:48:25

我正在测试三种不同条件下连续结果的差异。

在条件下,人工智能会测量结果。我为同一个样本做了两次。示例值可以是 2.2、2.1。这些是来自同一生物来源的“技术”复制品

我对条件 A 的四个“生物”复制做同样的事情:

A1, measure 1: 2.2
A1, measure 2: 2.1
A2, measure 1: 2.0
A2, measure 2: 2.1
A3, measure 1: 1.9
A3, measure 2: 1.8
A4, measure 1: 1.5
A4, measure 2: 1.6

我也有条件 B、C 和 D,在四个“生物”重复中的每一个中都有两个“技术”重复。

我将如何测试最能解释技术和生物学变异的平均差 (ANOVA)?我不想拟合一个模型,将每个测量值计算为单独的观察值,因为每一对都来自同一个生物样本。我假设必须有比仅仅平均对的更好的方法。

奖励:你如何在 R 中做到这一点?

假设我有如下数据:

> data
   condition sample measurement outcome
1          A      1           1     2.2
2          A      1           2     2.1
3          A      2           1     2.0
4          A      2           2     2.1
5          A      3           1     1.9
6          A      3           2     1.8
7          A      4           1     1.5
8          A      4           2     1.6
9          B      1           1     1.7
10         B      1           2     1.6
11         B      2           1     1.5
12         B      2           2     1.6
13         B      3           1     1.4
14         B      3           2     1.3
15         B      4           1     1.0
16         B      4           2     1.1
17         C      1           1     2.4
18         C      1           2     2.3
19         C      2           1     2.2
20         C      2           2     2.3
21         C      3           1     2.1
22         C      3           2     2.0
23         C      4           1     1.7
24         C      4           2     1.8

我可能不想做这样的事情:

summary(lm(outcome~condition, data=data))

提前致谢。

1个回答

问题是您有各种可能的随机性来源。个体随机性(线性回归中的正态误差项);在每种情况下,您的两次测量之间的差异;以及您采样的特定单位的变化。我想你可能想要类似的东西

model <- aov(outcome ~ condition + Error(samp + measurement), data=mydata)
summary(model)

希望有帮助。