构建神经网络需要微积分和微分几何吗?
人工智能
神经网络
结石
教育
2021-11-06 04:53:47
2个回答
神经网络本质上只是重复的矩阵乘法和激活函数的应用,所以你真的不需要大量的线性代数来构建一个简单的神经网络——如果你了解如何乘法矩阵,那可能就足够了。
更难的是通常通过反向传播完成的训练过程。你需要一点微积分,但微分几何是多余的。机器学习的微分几何中有一些有趣的话题,但远远超出了实现反向传播所需的范围。
要理解反向传播,您只需要了解函数的梯度以及这在直观上意味着什么;您还应该对链式法则有很好的了解。这就是你真正需要的,任何关于“多变量微积分”或类似课程的课程都足以让你开始学习。
当然,了解更多信息总不会有什么坏处,但幸运的是神经网络足够简单,您无需费力多年就可以实现基本的神经网络;尝试在掌握基础知识后立即开始,然后在进行中学习其余部分。
为了提供一些实用的建议,了解微积分的各个部分很重要。这主要是因为反向传播是现代库中的一种泄漏抽象。简而言之,有很多问题可能会出错(例如梯度爆炸或消失),您需要有关梯度下降的知识来处理它。
我强烈推荐Andrej Karpathys Lecture。他给出了一个易于理解和直观的解释。
其它你可能感兴趣的问题