对数线性与对数双线性

机器算法验证 物流 术语 对数线性
2022-04-03 04:28:07

我经常看到这两个术语。我无法真正分辨它们之间的区别,它们对我来说似乎相同。有人可以指出我的资源或简单解释其中的区别(如果有的话)吗?

对数线性是指一个模型,其中随机变量的条件概率y给定一些特征向量f(x,y). 模型的参数是权重θ.

p(yx)=exp(θf(x,y))yexp(θf(x,y))

2个回答

双线性函数(参见https://en.wikipedia.org/wiki/Bilinear_map)是一个在所有其他变量都固定时在每个变量中都是线性的函数。例如,f(x,y)=xy.

您的p(yx)是对数线性的,如果f(x,y)是线性的xy. 如果它是对数双线性的f(x,y)是双线性的xy.

请参见http://www.cs.utoronto.ca/~hinton/csc2535/notes/hlbl.pdf的幻灯片 9和https://piotrmirowski.files.wordpress.com/2014/06的幻灯片 17、23 和 24 /piotrmirowski_2014_wordembeddings.pdf作为参考。

教科书的分类数据分析处理,比如 Agresti (2002),N×D列联表C带组件Cij涉及三对数线性模型

logE[Cij]=λ(constant rate)logE[Cij]=λ+λiR+λjC(independence)logE[Cij]=λ+λiR+λjC+λijRC(saturated)
在哪里λ是标量,λR是长度N, λC是长度D, 和 λRC是一个N×D交互项矩阵。典型的识别约束包括λRλC均值为 0。

对数双线性模型在独立模型和饱和模型之间具有复杂性(但由于乘法项而需要不同的拟合过程)。最简单的对数双线性模型是

logE[Cij]=λ+λiR+λjC+μiνj(RC model* / log-bilinear)
在哪里μ是长度N, ν是长度D. (*Goodman 的原始配方吸收λ到另一个参数)。这里需要额外的识别约束,例如 Z 评分μ并且均值为零ν.

这些的标准处理来自 Goodman (1979),他称之为 RC 关联模型,但据我所知,这是通用的对数双线性结构。

增加乘法项的数量,比如 M,将模型的灵活性移向饱和模型,并被称为 RC(M) 模型,尽管只有 RC 模型似乎被称为对数双线性。