我拟合了一个具有多个级别的因子的模型,并且 R 需要很长时间才能拟合该模型。为什么是这样?
例如,如果我拟合回归来预测球员的薪水,并包括所有球员各自国籍的因子预测器,这将比使用连续预测器拟合球员薪水模型(如球员的薪水)要花费更长的时间。高度。
我拟合了一个具有多个级别的因子的模型,并且 R 需要很长时间才能拟合该模型。为什么是这样?
例如,如果我拟合回归来预测球员的薪水,并包括所有球员各自国籍的因子预测器,这将比使用连续预测器拟合球员薪水模型(如球员的薪水)要花费更长的时间。高度。
R 是典型的 - 与大多数统计软件包一样,它使用 QR 分解进行回归。
对于固定的,其中,仅计算分解本身实际上是的二次方- 将预测变量的数量加倍将使计算时间乘以大约 4。
因此,如果您从(线性回归)到说,您会期望它花费大约 600 倍的时间(实际上由于各种原因可能会少一些)。
因此,添加大量预测变量将意味着更长的等待时间。
这是因为对于具有个级别的因子,R 创建了指示变量。因此,假设有国籍,您正在拟合具有预测变量的多元回归模型,而如果您将其视为连续的(您不应该这样做),则与简单的线性回归相比。也许您可以创建一个新的因素,即大陆或其他更粗略的民族分组,以加快速度并获得更简洁的模型。