在通过具有置信区间的两个单边检验方法检验等效性时,计算 (1–2α) × 100% 置信区间以检查等效性。我认为这是因为您计算了 a 组平均值和 b 组平均值的 CI。
但是为什么不能计算组间差异的 95%-CI 呢?你能解释一下为什么这里一直使用 (1–2α) × 100% 吗?
在通过具有置信区间的两个单边检验方法检验等效性时,计算 (1–2α) × 100% 置信区间以检查等效性。我认为这是因为您计算了 a 组平均值和 b 组平均值的 CI。
但是为什么不能计算组间差异的 95%-CI 呢?你能解释一下为什么这里一直使用 (1–2α) × 100% 吗?
这不是因为您分别计算每个组的 CI。这是因为您分别计算了上端和下端的“不等价”。参数位于等价区间当且当
每个零件都通过水平的单面测试单独测试. 只有当两个检验都显着时,我们才能得出等价的结论。(这是非常直观的交并联合原理。)将其转换为单个置信区间,我们必须删除来自 CI 的上概率质量和下概率质量。所以我们最终得到. TOST-CI 只是单侧 CI 的交集。
顺便说一句,仍然可以使用CI,但它会不必要地保守。
这个问题的答案是 90% 是可能的,因为一个合乎逻辑的事实使得这种信心“奖励”成为可能。在 TOST 程序中,在 5% 的水平上进行了两次单尾检验。1 类错误率仍然保持在 5%,因为如果一个测试决定是 1 类错误,那么另一个测试决定不再是 1 类错误。例如,如果一个测试错误地声明差异大于 -3(即实际上它小于 -3),另一个测试它是否小于 3 的测试不能产生类型 1 错误,因为该值实际上是小于 3。