SPSS 随机数生成器有限制吗?

机器算法验证 spss 随机生成
2022-03-29 19:58:42

如果我需要 250,000 个随机数,SPSS 中的随机数生成器是否可以使用,或者随机性会开始退化?

换一种方式问,在 SPSS 中使用随机数生成器生成大量随机数有哪些实际限制?

3个回答

我认为 SPSS 与大多数现代软件一样,使用Mersenne Twister它的周期是所以从这个角度来看你是相当安全的。2199371

多达 623 个连续结果是不相关的,因此您可以放心地将一些连续结果视为独立的(经典的线性同余生成器不会出现这种情况)。

总而言之:现代随机数生成器对于统计中的所有普通应用程序都足够高性能......别担心。

SPSS Statistics 提供了 Mersenne Twister 和为了兼容性,一个旧的 shift-congruential 生成器。默认情况下,使用较旧的生成器。使用SET RNG=MTTransform>Random Number Generators菜单项来改变它。MT应该给你你需要的所有数字

还有一个用户贡献的 Python 函数可以获取真正随机的,而不是由大气噪声生成的伪随机数。这些是从一个网站上获取的,该网站有一些关于你应该阅读的数量的规则。包是tr_rnd0.1.zip. 它可以从SPSS 社区网站的 Python 模块集合中下载。当然,这需要你使用 Python 的可编程性。也可以从社区网站下载相关工具。

我使用 SPSS 统一函数在两年内每周创建一个随机样本。不要这样做。他们不生成随机样本。重新打开 SPSS 时,相同的数据集将生成相同的随机样本。并非所有案例都具有相同的选择概率(取决于文件的排序)。

我的建议是依次使用几种随机化方法。例如,首先随机排序,然后使用选择随机样本功能。