我一直在阅读 David Silver 的关于价值函数逼近的演讲(强化学习课程简介)。在第 43 页,他找到了未知参数向量的线性最小二乘法的解决方案. 他声称,对于特征,反转矩阵是,但是使用 Sherman-Morrison 算法的增量解决方案,复杂度为是可能的(见图)。由于Sherman-Morrison 公式允许计算可逆矩阵之和的逆和外部产品,, 的向量和,我真的不明白这也适用于这种情况。
使用 Shermann-Morrison 的矩阵逆增量解Ø (n2)O(n2)
机器算法验证
机器学习
强化学习
线性代数
逆矩阵
2022-03-25 14:55:46
1个回答
在线性回归的背景下,估计给定参数. 该公式中的主要计算负担是矩阵的求逆. 在批量学习的用例中,我们已经估计了以及对于从我们之前的迭代。当我们得到另一批时,我们可以研究如何将其表示为形式为. 请注意,额外的样本/批次将扩展连续但它会离开与以前的尺寸相同。因此,我们有.
其它你可能感兴趣的问题