我只是在学习(更多)关于自动微分(AD)的知识,在这个阶段,对我来说这有点像黑魔法。其Wikipedia 文章的第二段使它听起来好得令人难以置信:它非常快且准确(没有四舍五入,没有离散化)。我想知道为什么有限差分(FD)在科学计算中如此普遍。查找这个,我似乎只找到关于如何实现 AD、AD 的优点以及它在基于梯度的优化器中的应用的教程。但是什么时候不使用 AD 而使用 FD 的例子是什么?肯定有很多。
仅举一个例子,在计算电磁学中,FD 方法是非常标准的。为什么我们不能用 AD 传播麦克斯韦方程(FDTD:为什么不是 ADTD?)?这显然不是因为开发人员没有意识到这一点,因为同样的人为了逆向设计目的实现了 AD(为什么用 AD 而不是 FD 来进行逆向设计?)。天真地,在我看来,在传播麦克斯韦方程组时,精确导数似乎比对目标函数求导数更重要。