当为远程设备和物联网设计软件时,必须考虑系统如何管理各种故障,无论是软件还是硬件。
如果系统识别出软件错误,它可能会通知云并恢复到引导加载程序。如果系统识别到硬件外围设备问题,它可能会停止使用它并通知云。如果系统发生故障,它必须质疑其自身的健全性——比方说,当 NVM 不可靠时,它可能需要完全关闭。
这是一个非常大和重要的问题,其余的软件应该建立在这个问题上。
我相信这个问题很常见,足以编写指南、教程和文献,因此我们不必在每个单独的项目中自己重新发明它。
我想知道是否有推荐的文献、教程或指南来设计远程设备软件的稳健性,尤其是关于图像更新。
编辑:这里的重点不是错误检测,而是如何设计沙箱,在物联网设备环境中可以安全地处理错误和故障。