我最近一直在研究求解微分方程的自动微分。我了解使用对偶数等求导数等的基本思想。但是,我觉得我不理解自动微分和对偶数的几何解释。
让我们考虑一个简单的微分问题或微分方程组。
因此,让我首先为我如何理解自动微分在数值求解微分方程中的应用设置一点背景。如果我犯了任何错误,请纠正我。因此,如果您有一个具有合理时间尺度分离的相对低维系统,那么您可以使用一些二阶显式或 RK 类型的求解器。这应该提供良好的准确性和快速的计算时间。在这种情况下,您不需要使用自动微分,因为您可以f(y,t)
直接计算导数——如果求解器是显式的。
似乎 AD 与较大的方程组更相关,在这些方程组中,时间尺度分离较少且刚度较大。在这些情况下,隐式求解器是最好的方法。但是当使用隐式求解器时,您必须使用牛顿法或安德森加速度等方法来求解求根问题。
所以在牛顿法中,我们必须计算原微分方程的雅可比. 在找到隐式方程的根时,AD 对于计算微分方程的原始 RHS 的雅可比变得相关或有用。
似乎较旧的方法是在求根实现中使用数值微分或符号方法来表示雅可比。而在数值微分的情况下,这很容易受到浮点错误的影响,并且通常是病态的。在象征性的情况下,这通常解决起来很慢。
这就是我对为什么使用 AD 的理解。
但是,在 AD 的许多解释中,作者将解释使用 AD 的原因,但随后将深入研究对偶数和对偶数算术的代数结构。所以我对双数背后的几何直觉没有感觉。我得到了代数证明。我知道双数算术是链式法则的应用。但我希望有人可以解释什么是对偶数以及为什么它们可以求解导数和雅可比数背后的某种图形直觉。是否有一些图形解释值代表的数字和导数是什么?这些如何以图形方式组合以产生函数的整体导数?
任何帮助表示赞赏。