机器算法验证 - YOLO 物体检测器中的 sigma 函数是什么？ - 吾爱随笔录

YOLO 物体检测器中的 sigma 函数是什么？

机器算法验证神经网络图像处理符号物体检测约洛

2022-04-10 20:13:22

我已经阅读了YOLO9000 论文，因为他们提到网络预测边界框的 5 个坐标，并从中找到准确的中心坐标以及宽度和高度。我对这些方程式感到困惑。

\begin{aligned} b_{x} & = σ (t_{x}) + c_{x} \\ b_{y} & = σ (t_{y}) + c_{y} \\ b_{w} & = p_{w} e^{t_{w}} \\ b_{h} & = p_{h} e^{t_{h}} \\ P r (o b j e c t) \times I O U (b, o b j e c t) & = σ (t_{o}) \end{aligned}

$\begin{align} b_x &= \sigma(t_x) + c_x \\[3pt] b_y &= \sigma(t_y) + c_y \\[3pt] b_w &= p_we^{t_w} \\[3pt] b_h &= p_he^{t_h} \\[3pt] Pr({\rm object})\times IOU(b, {\rm object}) &= \sigma(t_o) \end{align}$

在这些方程中，代表什么？为什么他们对宽度和高度使用指数？ $\sigma$

2个回答

它是逻辑 sigmoid 函数：它的界限在 0 和 1 之间，在他们的情况下这是一个理想的属性（图片来自Wikipedia）：

σ (x) = \frac{1}{1 + e^{- x}}

$\sigma(x) = \frac 1 {1+e^{-x}}$

逻辑乙状结肠

关于指数，请参阅此答案。

除了使用符号的符号之外，一个图像的标题将此函数命名为“sigmoid”函数。从纸上看， $\sigma$

图 3：具有维度先验和位置预测的边界框。我们将框的宽度和高度预测为与簇质心的偏移量。我们使用 sigmoid 函数预测相对于过滤器应用位置的框的中心坐标。

“sigmoid”函数是某个函数的众多名称之一。这个名字在神经网络文献中特别常见；有关详细说明，请参阅函数有标准名称吗？ $e^x/(1+e^x)$

其它你可能感兴趣的问题

上一篇如何可视化分布随时间的演变？下一篇降维技术在深度学习中有用吗？