大多数处理深度学习的公司(汽车 - Comma.ai、Mobileye、各种汽车制造商等)确实会收集大量数据进行学习,然后使用大量计算能力从这些大数据中训练神经网络 (NN)。我猜这个模型主要是因为大数据和训练算法都应该保密/专有。
如果我理解正确,深度学习的问题是需要:
- 值得学习的大数据
- 大量硬件从这些大数据中训练神经网络
我正在尝试考虑如何在这种情况下使用众包。是否可以将NN的训练分发给人群?我的意思不是将大数据收集到一个中心位置,而是从用户硬件上的本地数据(以分布式方式)进行训练。这样做的结果将是大量训练有素的 NN,最终将以机器委员会(CoM) 的方式合并为一个。这样的模型可能吗?
当然,上述模型确实有一个明显的缺点——无法控制用于学习的数据(用户可能故意提交错误/虚假数据,这会降低最终 CoM 的质量)。然而,这可以通过将随机数据样本发送到中央社区服务器进行审查来处理。
示例:想象一个功能强大的智能手机使用其摄像头从车辆仪表板捕捉道路并将其用于训练车道检测。每个用户都将自己进行培训(可能包括任何手动工作,例如用于监督学习的输入图像分类等)。
我想知道上面提出的模型是否可行。或者有没有更好的模型来说明如何使用众包(用户社区)来处理机器学习?