计算科学 - 随机最速下降的最佳样本量 - 吾爱随笔录

认为 $g(x_{1:n})$ 是梯度的估计，在随机最速下降算法的每一步计算。数据集 $x_{1:n}$ 在每一步都模拟，所以如果 $n$ 小算法速度快但不稳定，而如果 $n$ 很大它很慢但很稳定。到目前为止，我刚刚尝试了许多 n 值，但也许有人知道确定 n 的更好方法。

认为 $Var(g(x_{1:n})) = f(n)$ 是已知的（即我知道梯度的方差如何随样本量变化），我正在考虑：

a) 最小化以下类型的损失函数：

L o s s (n) = f (n) + n \times c .

$Loss(n)=f(n)+n×c.$

b) 绘制 $f(n)$ 反对 $n \times c$ 尝试在视觉上确定一个好的样本大小 n。

就我而言 $c$ 是模拟所需的时间 $x_{i}$ ，例如 0.1 秒。我不认为将不同单元加在一起的函数最小化有多大意义，所以我想知道是否有任何方法可以将 CPU 时间转换为更合理的时间。