我有大约 14.000 个观察值,有一个自变量interactions和一个因变量accuracy。准确率可以是 0(错误分类)或 1(真实分类)。如下图所示,两者之间存在微弱但具有统计学意义的关系(晶须指定 95% 的置信区间)。

我想在交互的可能值上绘制一个平滑的图,而不是像上图中那样对它们进行分箱。我已经尝试在 R 中使用 GAM 来做到这一点,但我最终得到了下图,这显然是错误的。我也尝试过逻辑回归,它最终成为一条直线,因此没有捕捉到interactions = 100.

如何获得两个值之间关系的平滑图,以捕获准确性的初始上升然后收敛interactions=100?如果也可以推断出置信区间,那将是首选。数据可以在codeshare.io找到。超过 400 的交互并不有趣,因此如果需要,可以将它们排除在外。
