R中的随机选择

数据挖掘 r 数据
2022-03-03 12:36:44

我正在尝试创建一个比较组。到目前为止,该组包含 45 个数据点,我需要填充剩余的 55 个(总共 100 个数据点)。

剩下的 55 个需要是从更大的数据集中提供的随机选择。对于会创建随机化循环的 R 代码有什么建议吗?

1个回答

这将为您提供一个样本,其中包含来自您拥有的较大数据集的 55 条记录。

 sample <- df[sample(1:nrow(df), 55, replace=FALSE),]

如果你想制作一个可重现的样本示例,你需要set seed这样:

 set.seed(57)
 sample <- df[sample(1:nrow(df), 55, replace=FALSE),]

因此,稍后您可以使用相同的种子来获得相同的结果。

psreplace=FALSE表示之后从 中挑选出来的每条记录都df将包含在样本中,将被排除在 之外,df并且不会被多次选择。