如何从数据中删除不需要的字符

数据挖掘 r 数据清理
2022-01-29 23:22:04

我需要编写一个函数来识别和删除向量中一些数值后的“*”字符。我还需要结果向量是一个数字向量。

c("21,34,99*", "56,90*", "45*")

我需要删除*不需要的“”。

我想编写函数,因此每当需要进行数据清理时,我都可以使用函数并传递某些参数。

1个回答

正如其他人正确指出的那样,应该在 SO 中发布。

简单的解决方案是:

  1. 在“*”上拆分并选择拆分的第一部分。

  2. (1)应用于列表项并返回一个向量。

    x <- c("21,34,99*", "56,90*", "45*")               #test case
    
    data_clean <- function(x) sapply (strsplit(x , '[*]' ), `[` , 1)
    data_clean(x)