假设我是 Gmail 之类的电子邮件提供商。假设我有两类电子邮件地址:垃圾邮件发送者和非垃圾邮件发送者。当我的服务器收到邮件时,我需要快速检查该电子邮件 ID 是否在垃圾邮件发送者集中,如果是,我会采取一些措施。
问题是每个电子邮件 ID 可能是几个字节(例如每个 10 个字节),我可能有 10 亿个垃圾邮件发送者,所以我需要 10GB 的 RAM 来将电子邮件存储在主内存中。
假设我只想使用 1 GB RAM。为此,我现在准备接受一个大概的答案。特别是我可以接受被错误标记为属于垃圾邮件集的非垃圾邮件,但反之亦然。我将如何做?