下面的示例取自deeplearning.ai中的讲座,显示结果是逐元素乘积的总和(或“逐元素乘法”。红色数字表示过滤器中的权重:
但是,大多数资源都说它是使用的点积:
“……我们可以将神经元的输出重新表示为 ,其中是偏置项。换句话说,我们可以通过 y=f(x*w) 计算输出,其中 b 是偏置项。换句话说,我们可以通过执行输入和权重向量的点积,添加偏置项来产生 logit,然后应用变换函数来计算输出。”
布杜马,尼基尔;洛卡西奥,尼古拉斯。深度学习的基础知识:设计下一代机器智能算法(第 8 页)。奥莱利媒体。Kindle版。
“我们采用 5 5 3 过滤器并将其滑过整个图像,并在此过程中采用过滤器和输入图像块之间的点积。对于所拍摄的每个点积,结果都是一个标量。”
“每个神经元接收一些输入,执行点积,并可选择非线性地跟随它。”
“卷积的结果现在相当于执行一个大型矩阵乘法 np.dot(W_row, X_col),它评估每个过滤器和每个感受野位置之间的点积。”
但是,当我研究如何计算矩阵的点积时,似乎点积与对逐个元素的乘法求和不同。实际使用了什么运算(逐个元素乘法或点积?),主要区别是什么?