工作时将 DataFrame 保存在内存中 - VS Code 中的 R 与 Python

数据挖掘 Python 工作室
2022-03-01 09:58:40

我正在考虑从 R-Studio 迁移到 Python。所以我只是用 VS Code 作为我的编辑器来启动 Python。我的目的主要是分析数据、构建预测模型并通过 Web API 使这些模型可用。

在 R-studio 中使用大型数据集工作时,我可以运行脚本从 CSV 文件中读取数据,然后我可以使用常规统计方法探索数据。我只需要加载一次数据集,这很好,因为加载大型数据集通常需要一些时间。数据探索需要大量重复的“探测”来查看直方图、比较计数等。因此,每次更改脚本或运行脚本来查看绘图时不必重新加载数据,这是一个很大的优势。

但是,在 VS Code 中使用 Python,在我看来,如果我在脚本顶部的方法中加载数据框,然后有一个方法来绘制图表,那么每次运行该脚本时,数据都是重新加载。因此,如果我想绘制 20 个直方图,每次只更改标题,我需要在每次修改和运行脚本时重新加载数据。

我是否缺少 Python 和 VS Code 的某个功能,或者我的总结是否正确?

1个回答

这更多是关于 IDE 而不是编程语言。使用 RStudio 时,您可以导入数据,IDE 会将其保存在内存中,这样您在同一会话中编写后续代码时就不必重新加载它。

要在 Python 中执行此操作,请考虑使用Jupyter Notebook或类似的东西。这样,您只需导入一次数据框,然后就可以根据需要执行探索性分析、可视化和构建模型。