为了构建线性回归模型和/或多元回归样条模型,每个变量需要多少个案例?
还,
- 这是经验法则,还是存在统计依据?
- 有参考书目吗?
为了构建线性回归模型和/或多元回归样条模型,每个变量需要多少个案例?
还,
根据经验,我经常听说每个变量有 10 个案例。目前尚不清楚这是否意味着您从 10 个具有 1 个协变量的案例开始,还是从 20 个案例开始(因为您也因截距而失去了一定程度的自由度)。我扫描了我的一些旧统计书籍的索引,并没有找到任何关于讨论这个地方的参考(尽管它可能在某个地方,只是没有以我能找到的方式索引)。我也不知道静态文献中的任何参考资料或这种经验法则的任何统计依据。
此外,我看不出怎么可能,而且我认为这样的经验法则毫无价值。案例的最小数量取决于许多事情,例如,收集数据的成本,以及您的目标(显着性检验的最小值?,在参数估计中达到指定精度水平的最小值?,预测未来的最小值具有一定准确性的案例?等)。由于没有一个数字(例如 10 / 协变量)可能对所有目标都是最优的,不惜一切代价收集更多数据并使用所有级别的可用资源,我认为不存在统计上的理由。
我不知道关于样条曲线的任何经验法则,但我相信相同的论点意味着任何这样的论点同样毫无价值。