我正在尝试开发一种人工智能,它可以在我们运行测试用例的同时帮助调试大型软件系统。AI 可以访问系统开发人员可以访问的任何内容,即日志文件和来自跟踪点的执行数据。它还可以访问系统的结构和所有源代码。
该 AI 的最终目标是能够在执行期间检测运行时错误,并定位这些错误的来源。
我正在考虑使用深度神经网络,其中输入将是执行数据和日志输出。使用此输入,它将能够验证我们正在运行的系统的当前版本是否正常运行。这种方法的问题在于,它所评估的系统会随着它的开发而不断变化,因此 NN 将拥有的唯一培训材料来自系统的最后一个稳定版本(甚至可能会有一些错误)。此外,为我们可以训练神经网络的系统生成测试用例将非常耗时,并且会破坏首先使用神经网络的目的。
我想知道您认为哪种 AI 设计适合这项任务。如果您想了解与该问题相关的任何其他信息,请告诉我。据我所知,以前从未做过类似的事情。
值得一提的是,我的团队有一些非常强大的机器,我们可以在上面运行 AI。