我在看两篇论文
- Petar Veličković和_
- GaAN:用于在大型和时空图上学习的门控注意网络,作者张佳妮。
我正在尝试实施第二篇论文,但在理解 GAT 和 GaAN 之间的差异时遇到了一些麻烦。通过查看 GaAN 论文中的等式 1,我只能看到与 GAT 的两个不同之处。
- 第一个区别是他们用初始特征图做点积,
- 有另一个全连接层来投影结果。
还有什么我想念的吗?
我在看两篇论文
我正在尝试实施第二篇论文,但在理解 GAT 和 GaAN 之间的差异时遇到了一些麻烦。通过查看 GaAN 论文中的等式 1,我只能看到与 GAT 的两个不同之处。
还有什么我想念的吗?