现在,玻尔兹曼机是基于能量的无向网络,这意味着没有前向计算。相反,对于每个输入配置,计算标量能量以评估此配置。能量越高,发生的可能性越小从目标分布中采样。
通过对隐藏部分的所有可能状态求和,通过能量函数定义概率分布.
如果我理解正确,会添加隐藏单元以捕获高阶交互,从而为模型提供更多容量。
那么,我们如何计算这些隐藏单元的值呢?或者我们是否没有明确计算这些值,而是近似于边际“自由能”(这是所有可能状态的总和的负对数))?
现在,玻尔兹曼机是基于能量的无向网络,这意味着没有前向计算。相反,对于每个输入配置,计算标量能量以评估此配置。能量越高,发生的可能性越小从目标分布中采样。
通过对隐藏部分的所有可能状态求和,通过能量函数定义概率分布.
如果我理解正确,会添加隐藏单元以捕获高阶交互,从而为模型提供更多容量。
那么,我们如何计算这些隐藏单元的值呢?或者我们是否没有明确计算这些值,而是近似于边际“自由能”(这是所有可能状态的总和的负对数))?