如果这么多人使用 set.seed(123) 不会影响世界报告的随机性吗?

机器算法验证 随机生成
2022-01-22 04:54:26

似乎每个人都只是使用set.seed(123)set.seed(1234)在进行随机抽样时。如果这么多人只使用选择的几个整数set.seed(),这是否意味着每个人都在从随机数生成器的相同状态中进行绘制,因此所有结果都不是真正的随机样本?

1个回答

一个有趣的问题,虽然我不知道它是否可以在 CV 回答。一些想法:

  • 如果您进行涉及随机抽样的分析,最好使用不同的种子重新运行它,以评估您的结果是否对种子的选择敏感。如果您的结果变化“很大”,您应该重新审视您的分析(和/或您的代码)。

    如果每个人都这样做,我不会过分担心每个人最终使用相同种子的综合效果,因为经过这个理智检查,每个人的结果都不再依赖它了。

  • 鉴于随机数在很多很多不同的上下文中使用,在不同的应用程序中使用不同的模型,以不同的顺序和不同的方式转换伪随机数,我不会太担心整体可能的系统效应。即使,是的,即使根据前面的要点,即使每个单独的研究人员看不到这种效果,理论上这种效果也可以在总体水平上可见。

  • 最后,我个人从不使用 123 或 1234 作为种子。我使用 1 ;-) 或年份。或者日期。我真的不认为 123 或 1234作为种子普遍存在。你当然可以在某个地方进行投票。