我想构建一个 AI,可以将对象的图像转换为解剖学上准确的 3D 模型。为此,我正在考虑为深度确定性策略梯度调整以下代码:https ://keras.io/examples/rl/ddpg_pendulum/
我考虑 RL 的原因:
我没有为项目采购大型数据集所需的技能(3D 建模)。我希望 RL 可以通过状态奖励学习适应较小的数据集来帮助我克服这个问题。我主要寻找人类和动物的解剖模型。这些很难大量找到。
我的第二个担忧是这些模型所需的密度(多边形数)可能相当高。我不确定 NN 输出高密度模型在计算上是否可行。但是,我认为 RL 代理可以逐步遍历并在 3D 空间中一次写入每个顶点。与前馈网络中的单个输出层相比。
但是,这意味着它必须处理相当大的状态空间(长度为 50,000 或更高的数组)。
尽管如此,RL 主要用于视频游戏和 OpenAI 健身房的简单控制问题。将 RL 用于这种复杂程度是浪费时间吗?