我正在尝试创建一个比较组。到目前为止,该组包含 45 个数据点,我需要填充剩余的 55 个(总共 100 个数据点)。
剩下的 55 个需要是从更大的数据集中提供的随机选择。对于会创建随机化循环的 R 代码有什么建议吗?
我正在尝试创建一个比较组。到目前为止,该组包含 45 个数据点,我需要填充剩余的 55 个(总共 100 个数据点)。
剩下的 55 个需要是从更大的数据集中提供的随机选择。对于会创建随机化循环的 R 代码有什么建议吗?
这将为您提供一个样本,其中包含来自您拥有的较大数据集的 55 条记录。
sample <- df[sample(1:nrow(df), 55, replace=FALSE),]
如果你想制作一个可重现的样本示例,你需要set seed这样:
set.seed(57)
sample <- df[sample(1:nrow(df), 55, replace=FALSE),]
因此,稍后您可以使用相同的种子来获得相同的结果。
psreplace=FALSE表示之后从 中挑选出来的每条记录都df将包含在样本中,将被排除在 之外,df并且不会被多次选择。