据我了解,标准受限玻尔兹曼机(RBM)表现出二进制随机可见和隐藏单元。二进制和可见单位的联合概率由统计物理学中熟悉的玻尔兹曼因子给出:
一个特定的配置由两组二进制向量组成,,然后所有配置的总和对应于所有可能的此类对的总和。
还有另一种类型的 RBM,称为高斯 RBM,它使用连续单位,因此是真正有价值的。显然现在必须修改配置的总和。
现在考虑 MNIST 数据集,其中可见单元对应于从 0 到 255 的整数值像素值。事实上,这些可见单元不适用于任何 RBM 算法。一种解决方案是将 256 值离散向量扩展为更大的二进制向量,然后使用第一个 RBM。另一种解决方案是将像素除以 255,以便它们位于单位间隔内。然后可以将它们视为真实的,并应用高斯 RBM。
我的困惑是我发现了一些案例,例如
http://www.pyimagesearch.com/2014/06/23/applying-deep-learning-rbm-mnist-using-python/ https://gist.github.com/dwf/359323
其中数据被重新缩放以位于 [0,1] 范围内,并且 RBM 被视为具有随机二进制单位。有人可以向我解释为什么这是可以接受的吗?