数据挖掘 - R中的随机选择 - 吾爱随笔录

数据挖掘 r 数据

2022-03-03 12:36:44

我正在尝试创建一个比较组。到目前为止，该组包含 45 个数据点，我需要填充剩余的 55 个（总共 100 个数据点）。

剩下的 55 个需要是从更大的数据集中提供的随机选择。对于会创建随机化循环的 R 代码有什么建议吗？

1个回答

这将为您提供一个样本，其中包含来自您拥有的较大数据集的 55 条记录。

 sample <- df[sample(1:nrow(df), 55, replace=FALSE),]

如果你想制作一个可重现的样本示例，你需要set seed这样：

 set.seed(57)
 sample <- df[sample(1:nrow(df), 55, replace=FALSE),]

因此，稍后您可以使用相同的种子来获得相同的结果。

psreplace=FALSE表示之后从中挑选出来的每条记录都df将包含在样本中，将被排除在之外，df并且不会被多次选择。

其它你可能感兴趣的问题