我有一个具有连续自变量和连续因变量的数据集。为了使用自变量预测因变量,我运行了一组回归模型并尝试将它们相互比较。以下是供参考的结果:
我可以解释R-squared value / Coefficient of determination
每个模型的含义。但是,我无法理解是什么Negative Log Likelihood
意思。特别是,为什么线性回归和增强决策树是无穷大,而决策森林回归是有限值?
编辑:
数据描述:进入这三个模型的数据都是连续自变量和连续因变量。共有 542 个观测值和 26 个变量。
这 542 个变量被拆分为 70 - 30 以获得训练和测试数据集。因此,训练数据集有 379 个观测值和 26 个变量;测试数据集有 163 个观测值和 26 个变量。没有丢失的数据。
编辑 2 可能的解释 - (单击此处):显然,Azure ML 中的线性回归和提升树不计算负对数似然指标 - 这可能是 NLL 在这两种情况下都是无穷大或未定义的原因。