例如,我有 2 个无法放入 RAM 的矩阵。我需要可以处理这个的算法或库。最好是 Matlab 或 Python。
我认为它可以是一些块矩阵乘法?另外我觉得有一个类比硬盘<->ram,gpu ram<->cpu ram,cpu ram<->cpu cache,那么我们可以采取一些cpu cache优化技术吗?
似乎在 python 中我可以使用 numpy.memmap 但我不了解这种方法的内存消耗,也许它根本不是最佳解决方案。
例如,我有 2 个无法放入 RAM 的矩阵。我需要可以处理这个的算法或库。最好是 Matlab 或 Python。
我认为它可以是一些块矩阵乘法?另外我觉得有一个类比硬盘<->ram,gpu ram<->cpu ram,cpu ram<->cpu cache,那么我们可以采取一些cpu cache优化技术吗?
似乎在 python 中我可以使用 numpy.memmap 但我不了解这种方法的内存消耗,也许它根本不是最佳解决方案。