不需要 scipy 的 sklearn 的较小替代品?

数据挖掘 机器学习 scikit-学习 scipy
2022-02-18 19:03:10

我正在打包我的模型以部署在 aws lambda 中,所有依赖项的大小限制为 250mb。

Sklearn,如果你包含它的 numpy 和 scipy 依赖项,那就是一个巨大的包。

sklearn 是否有不需要比 sklearn 小的 scipy 的替代品?

谢谢!

1个回答

你检查了tinynumpy吗?

无论如何,我很少找到著名软件包的替代品(除了 scikit-image 而不是 opencv)。通常对我有用的是:

  1. 尽可能精简模型(例如权重量化)
  2. 检查我从每个模块中使用的功能的代码。一旦我有了它们的列表,我就会检索相应的 python 文件并摆脱其余的
  3. 尝试将我的流程拆分为多个功能(例如,一个执行数据处理的功能,一个执行模型并进行推理的功能)

第二点很关键。以我的经验,很少需要整个软件包。

但是,根据具体情况,AWS Lambda 也可能不适合您的需求。