R 基函数glm()使用 Fishers Scoring 进行 MLE,而glmnet似乎使用坐标下降法来求解相同的方程。坐标下降比 Fisher Scoring 更省时,因为 Fisher Scoring 除了计算其他一些矩阵运算外,还计算二阶导数矩阵。这使得执行成本很高,而坐标下降可以在 O(np) 时间内完成相同的任务。
为什么 R 基函数会使用 Fisher 评分?这种方法比其他优化方法有优势吗?坐标下降和Fisher Scoring如何比较?我在这个领域相对较新,所以任何帮助或资源都会有所帮助。