我看到了 YouTube 发布的这篇研究论文,关于他们如何使用深度学习神经网络进行推荐。它位于此处:https ://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf
在论文中,候选生成神经网络模型输出了一个 256 维的 softmax,它充当了 1M 视频类中每一个的“输出嵌入”。
例如,这怎么可能在 tensorflow 中实现?softmax 不应该只是一维的吗?如果模型像他们所说的那样输出这样的“嵌入”,那么训练数据的标签将如何格式化为 256 维?换句话说,他们如何计算训练数据集中每个视频的 256 维向量?
非常感谢你们的时间和帮助,伙计们!