用于训练分类器的 Bengin 文件的最佳位置?

数据挖掘 数据集
2022-02-20 05:09:47

尝试训练深度神经网络分类器,我从 virusshare.com 获得了一个大数据集,但是我还需要一些正常(非恶意软件)文件。格式必须是 PE(x64 或 x86)。

有谁知道在哪里可以获得这样的数据集?还是我必须创建自己的?

1个回答

您可以使用VirusTotalVirusTotal 有一个私有 API,您可以在其中查询文件(例如只有那些有 0 个正数的文件)然后下载文件,您需要联系他们以了解它的成本。

如果您不需要二进制文件本身并且您使用的信息与文件结构不同,则可以使用endgame 的数据集