我正在阅读论文Learning to Prune Filters in Convolutional Neural Networks,这是关于使用强化学习(策略梯度)修剪 CNN 过滤器的。论文说剪枝代理(代理是卷积神经网络)的输入是一个形状为 的二维(N_l, M_l)
数组,其中N_l
是过滤器的数量,(M_l = m x h x w
和是过滤器维度),输出是一个动作数组(每个元素都是0(不必要的过滤器)或1(必要的))并表示为了近似梯度,我们必须对输出时间进行采样(使用 REINFORCE 算法)。m
l
h
M
由于我有一个输入,我如何多次采样输出分布(不更新 CNN 参数)?
如果我遗漏了什么,请告诉我我错在哪里