我正在学习计算机视觉课程,我有这个练习:编写一个程序,给定手部图像,它可以识别手是张开、合拢、打拳还是保持“ok”姿势,只使用迄今为止提供的技术(像素 4/8 连接、连接区域、轮廓查找、孔查找、像质心、面积、周长、偏心率、图像矩、图像变换(例如反转/功率/对数/伽马校正/对比度拉伸)、直方图计算和均衡)。
我已经用一些基本的 blob 属性完成了它(闭合的手具有低偏心率,“ok”有一个孔,张开的手在 blob 中的内接椭圆区域和具有低偏心率的 blob 区域本身之间有很大的差异) ..它似乎有效,但第一张图片有点问题。
我认为可能还有更多东西可以制作出更强大的算法。也许某种时刻属性?一些blob轴/方向/极值点有帮助吗?
PS测试图片: