据我了解,深度学习有两个阶段:第一个是训练,第二个是推理。第一个通常在 GPU 上完成,因为它们具有强大的并行能力等。第二个,推理,虽然它可以在 GPU 上完成,但由于功耗的原因并没有太多使用,而且因为推理时呈现的数据要少得多,所以不需要 GPU 的全部功能。相反,FPGA 和 CPU 通常用于此目的。
我的理解也是,一个完整的深度学习系统将同时具备训练系统和推理系统。
我的问题是:两个系统都需要在同一个应用程序上吗?
让我们假设一辆自动驾驶汽车或一个完成视觉和图像识别的应用程序,它是否既有要训练的训练系统,也有要执行的推理系统?或者它只有推理系统,并且将与已经训练并建立数据库的远程系统进行通信?
另外,如果应用程序有两个系统,它是否有足够大的内存来存储训练数据?鉴于它可以是一个小型系统,并且内存最终是有限的。