我想知道在内存管理方面学习最佳实践的最佳资源是什么。例如,假设我有以下代码:
df.read_csv() #one instance of a df
df1 = df.drop_duplicates #another instance of a df, total 2
df1_melt = df1.melt() #another instance of a df
df1_aggregated = df1_melt.groupby()... #another instance, total 4
df_mutual = pd.merge(df1_aggregated, df1_melted) #created another instance of a df, total 5
在上面的示例中,我们创建了 5 个数据帧并将它们存储在内存中,但我们实际上只对一个感兴趣。我读过你可以将这些变量的引用计数减少到0,然后当你删除变量时,它可能会被垃圾回收。有没有更好的编程方法可以避免在内存中创建多个数据副本?