随机数生成在计算统计中有哪些重要用途?

机器算法验证 假设检验 蒙特卡洛 算法 随机生成 计算统计
2022-02-16 09:58:54

随机数生成器 (RNG) 在计算统计中如何以及为何如此重要?

我知道在为许多统计测试选择样本以避免偏向任一假设时,随机性很重要,但是在计算统计的其他领域中随机数生成器是否很重要?

2个回答

有很多很多例子。太多了,无法列出,而且任何人都可能无法完全了解(可能除了@whuber,他永远不应被低估)。

正如你提到的,在对照实验中,我们通过将受试者随机分成治疗组和对照组来避免抽样偏差。

bootstrapping中,我们通过从固定样本中随机抽样和替换来近似从总体中重复抽样。这让我们可以估计我们估计的方差,等等。

交叉验证中,我们通过将数据随机划分为切片并组装随机训练和测试集来估计估计的样本外误差。

置换检验中,我们使用随机置换在原假设下进行抽样,从而允许在各种情况下执行非参数假设检验。

bagging中,我们通过对训练数据的引导样本重复执行估计,然后对结果进行平均来控制估计的方差。

随机森林中,我们还通过在每个决策点从可用预测变量中随机抽样来进一步控制估计的方差。

模拟中,我们要求拟合模型随机生成新的数据集,我们可以将其与训练或测试数据进行比较,帮助验证模型中的拟合和假设。

马尔可夫链蒙特卡洛中,我们通过使用马尔可夫链探索可能结果的空间来从分布中采样(感谢@Ben Bolker 的这个例子)。

这些只是立即浮现在脑海中的常见日常应用。如果我深入挖掘,我可能会将该列表的长度加倍。随机性既是一个重要的研究对象,也是一个重要的工具。

这一切都是正确的,但并没有解决主要问题:具有任何 结果结构或序列可预测性的 PRNG 将 导致模拟失败。 卡尔·维特霍夫1 月 31 日 15:51

如果这是您关心的问题,那么问题的标题可能应该更改为“RNG 选择对蒙特卡洛结果的影响”或类似的内容。在这种情况下,已经考虑过 SE 交叉验证,这里有一些方向