数据挖掘 - 了解谷歌广而深的“广”部分 - 吾爱随笔录

谷歌广泛而深入的推荐模型听起来很酷，但我很难相信我掌握了广泛的部分，所以想检查一下我的理解。

他们的论文说：

Wide 组件包括用户安装的应用程序和印象应用程序的跨产品转换

每个示例对应一次展示

假设我们有 5 个应用程序，从 A 到 E。我的理解是，交叉乘积转换将表示为 20 列，代表installed和impressed应用程序的每个可能组合（有 25 个，但大概是 5 个“匹配”交叉乘积，例如and(installed=App_A, impressed=App_A)将被删除，因为大概谷歌足够聪明，不会给用户已经拥有的应用程序留下深刻印象）。假设我们有 3 个用户，称为 X - Z。X 安装了应用 A 和 C，显示应用 B 和 D。Y 安装了应用 B，显示 A 和 E。Z 安装了应用 A、C 和 D并显示应用程序 B 和 E。使用该数据集，交叉产品转换应该看起来（我认为）如下所示：

我的问题是；我对那里的转换的理解正确吗？如果是这样，那将在相当短的时间内形成一个巨大的矩阵，特别是考虑到他们拥有超过十亿用户和一百万个不同的应用程序。