我想用 4 到 5 个解释变量进行回归,但我只有 15 个观察值。无法假设这些变量是正态分布的,是否有非参数或任何其他有效的回归方法?
样本量非常小的回归
机器算法验证
回归
小样本
2022-03-03 14:10:30
1个回答
@Glen_b 关于回归1中正态性假设的性质是正确的。
我认为您更大的问题将是您没有足够的数据来支持 4 到 5 个解释变量。标准的经验法则2是每个解释变量至少应该有 10 个数据,即在您的情况下有 40 或 50 个数据(这是对于假设没有任何问题的理想情况)。因为你的模型不会完全饱和3(您的数据多于要拟合的参数),您可以获得参数(斜率等)估计,并且在理想情况下,估计是渐近无偏的。但是,您的估计很可能与真实值相差很远,并且您的 SE / CI 将非常大,因此您将没有统计能力。请注意,使用非参数或其他替代方法,回归分析不会让您摆脱这个问题。
您需要在这里做的是根据您所在领域的先前理论或您的预感选择一个解释变量(在查看您的数据之前!),或者您应该组合您的解释变量。后一种选择的合理策略是运行主成分分析(PCA) 并使用第一个主成分作为解释变量。
参考文献:
1.如果残差是正态分布而 Y 不是正态分布怎么办?
2.多元回归最小样本量的经验法则
3.可输入多元回归方程的自变量的最大数量
其它你可能感兴趣的问题