我正在寻找检测薄物体,如钢笔、铅笔和手术器械。边界框并不重要,但我正在寻找是否可以训练模型来检测对象及其方向。
典型的对象检测网络,如 R-CNN、YOLO 和 SSD 对类名和边界框进行编码。而不是边界框,我希望只编码 2 个点,一个开始一点一结局观点。物体的起点是人们抓住物体的地方。例如:
- 铅笔橡皮擦(起点)指向右上角 50 度。
- 手术器械与 x 轴成 10 度角,手柄指向右下方。
- 笔尖(端点)垂直向上。
- 叉子,起点是把手部分,终点是 4 个叉子所在的中间。
只要我可以编码起点和终点,我就可以确定方向。我需要在训练期间定义这些点。
问题是我是否可以在其中编码这些信息的现有模型(移动网络/inception/RCNN)?我想的一种可能的方法是使用 YOLO 和左上角的边界框将是起点(句柄),而边界框的宽度和高度将替换为端点(铅笔笔尖,叉尖。