参见R 的 {drake}。它允许您定义可重现的管道
plan <- drake_plan(
raw_data = readxl::read_excel(file_in("raw_data.xlsx")),
data = raw_data %>%
mutate(Species = forcats::fct_inorder(Species)),
hist = create_plot(data),
fit = lm(Sepal.Width ~ Petal.Width + Species, data),
report = rmarkdown::render(
knitr_in("report.Rmd"),
output_file = file_out("report.html"),
quiet = TRUE
)
)
# call the pipeline
make(plan)
德雷克的伟大之处在于你可以在任何时候重新加载任何raw_data
, data
, hist
, fit
, report
。如果您更改部分代码,make(plan)
{drake} 将找出哪个发生了更改并运行它。