问题
从问题中我们可以看出,现有的小型汽车领域的检测和分类信息已经被定位(以可用于机器训练的两组独立向量的形式),并且它们之间不存在已经存在的映射或其他对应关系。一组的元素和另一组的元素。它们是独立获得的,保持独立,并且仅通过该领域的惯例(今天的美学可接受和热力学可行的小型车辆形式)联系起来。
问题中陈述的目标是创建一个计算机视觉系统,该系统既可以检测汽车,又可以利用两个不同集合中包含的信息对其进行分类。
在哺乳动物的视觉系统中,也有两种不同的等价集;一种源于遗传算法,在神经网络几何学和视觉系统的生物电化学形成过程中表达的早期发展中的DNA;以及大脑和小脑中的认知和协调通路。
如果机器人、轮椅或其他车辆要避开交通,我们必须生产一个在某种程度上匹配或超过哺乳动物的防撞性能的系统。在预防犯罪、收费、销售批次库存、县交通分析和其他类似应用中,性能将再次有望达到或超过生物系统的性能。如果一个人可以记录品牌、型号、年份、颜色和车牌字符串,那么我们在这些能力中使用的机器也应该如此。
因此,这个问题与学术好奇心无关,因为它适用于当前的产品研发。
这个问题的作者注意到缺乏一个统一的数据集,可以用来训练它来检测和表征单个网络感兴趣的对象,这对于找到解决方案的挑战来说是恰当的和关键的。
方法
最简单的方法是组合两个功能的系统。
- D:I4→(I2,I2)1,(I2,I2)2,...
- C:(I2,I2)i→(I)i
输入的四个维度D,检测器,是水平位置、垂直位置、rgb索引和亮度来描述像素化图像;并且输出是边界框,作为与每个识别的车辆相对应的两个“角”坐标,第二个坐标相对于第一个坐标或整个帧的特定角。分类器,C,接收作为输入边界框并生成映射到与可用于分类的训练集标签对应的类别的索引或代码作为输出。该系统可以描述如下。
S:C∘D
如果系统不是颜色,则从输入的上述维度中减去一。如果系统处理视频,则将输入的维度加一并考虑使用 LSTM 或 GRU 单元类型。
上述替换为“∘”似乎是什么意思,“我使用来自检测数据集的图像作为输入,并在检测到的边界框之上获得分类预测。”
疑问句“如何验证在分类数据集上训练的分类模型是否正在处理来自检测数据集的图像?(就分类准确性而言)”似乎是指第二组不存在标签的事实对应于第一组的输入元素,因此无法直接获得准确度度量。由于没有明显的自动方法为预先检测到的包含可能多辆车辆的图像中的车辆生成标签,因此无法检查实际结果与预期结果。从分类集中组合多个车辆图像,用作整个系统的测试输入S只会在评估性能的一个方面有用D, 不是C.
解决方案
唯一评估准确性和可靠性的方法C是用于训练它的集合中被排除在训练之外的部分,并相信这些图像中描绘的车辆足以代表“汽车”的概念,以在由检测到的车辆范围内提供准确性和可靠性的一致性D在应用S. 这意味着信息的利用,即使通过任何任意算法或所有可能算法或并行性的集合中的并行性优化到可能的程度,也受到分类训练集的限制。集合元素的数量以及该集合中类别的全面性和分布必须足以实现这两个准确度指标之间的近似相等。
- 从标记集中对测试样本进行分类C排除在培训之外
- 对隔离的车辆进行分类D从它的训练输入
有额外的资源
当然,这个讨论是在一个特定的环境中进行的,系统定义为两个人工网络,一个涉及基于卷积的识别,另一个涉及特征提取,以及两个训练集。所需要的是一个更广泛的环境,可以看到已知车辆,以便S被评估并点击之间的信息传输D和C可用于区分分接点任一侧的错误。
无监督方法
另一种行动方案可能是不使用训练集对训练进行分类C根本上,而是在“无监督”方法中使用特征提取和自相关,然后在检测到分类稳定性时根据最终收敛指标评估结果。在这种情况下,边界框中的图像由D将用作训练数据。
自训练网络实现C然后可以使用整个分类训练集进一步评估。
进一步的研究
这两种方法的混合是可能的。此外,仅在极少数情况下进行独立训练会导致最佳性能。理解反馈最初由 MacColl 在其伺服机构基础理论的第 8 章中严格处理,后来应用于模拟电路的线性和稳定性问题,然后用于训练,首先是 GAN,可能会导致有效的方法来解决对两个网络进行双向训练。
进化的生物网络是在原位训练的,这表明可以通过找到同时在两个组件中创造最优的训练架构和信息流策略来获得最优性能。从来没有一个生物生态位被首先优化然后以某种方式插入或复制到更大的大脑系统的神经组件填充。这并不能证明这种组件可以是最佳的,但也没有证据表明已经出现的 DNA 驱动系统几乎没有针对大多数陆地条件进行优化。