我正在设计一个有 5 个变量的实验。一些变量有 2 个水平,而另一些有 3 个水平。我要使用的方法是拉丁超立方体,但我不知道有效实验的样本量应该是多少?
如何确定拉丁超立方抽样的样本量?
机器算法验证
采样
实验设计
样本量
2022-03-28 12:20:58
1个回答
您拥有的样本组合总数是(管他呢)。根据您的实验(以及取样的难度),理想情况下您应该对所有样品进行取样。如果没有,还有其他一些选择。
从技术上讲,您无法进行标准LHC 采样或正交采样,因为它要求每个维度具有相同数量的级别。但是,如果您使用 LHC,您可以使用(3 和 2 的最小公倍数)级别,然后将其映射到您的 2 级和 3 级空间。
您选择的样本数量取决于您,但更多的样本会给您提供更可靠的结果,并且还有助于避免变量之间的相关性(当您决定样本是什么时,您应该在实际取样之前检查这一点)。如果您希望您的效果大小相对于噪声较小,则选择更大的样本大小。
另一种可能是明智的方法是使用低差异序列,如 Sobol 序列。基本上,您在真实空间上进行序列,然后将每个维度映射到你的变量(所以如果你在你的下半部分得到一些东西您的第一个 2 级变量的维度,然后您选择 1 级等)。与 LHC 相比,这具有优势,您可以决定稍后添加更多样本,同时保持相对均匀的样本覆盖率以及变量之间的低相关性。此外,您不限于样本大小. 我成功地使用了这种方法,样本量低至 25。
其它你可能感兴趣的问题