最重要的是,您需要一个可靠的负载平衡基础设施。这就是真正的问题所在。在其他东西所在的位置提供负载平衡和索引的服务。拥有冗余计算或存储很容易。它也不是那么贵。正如您所指出的,有足够多的模型,其中大部分成本仅适用于实际使用时。
就像在这个Wikipedia 负载平衡页面上一样,负载平衡器通常被描绘成单个实例。尽管这是一个巨大的简化,但很少有跨供应商的负载平衡。因此,如果您的 AWS 负载均衡器关闭,那么拥有大量可用的 Google Cloud Functions 和 OneDrive 存储将毫无用处。您的 IoT 设备将无法找到这些服务。他们将查看您的云服务的虚假域/IP。
其余的无论如何都是冗余设置的。亚马逊发生的事情是他们无意中关闭了单点故障。那个带有大红色的服务器从不关闭它的标志。他们错误地关闭了东海岸 S3的索引服务器。
这些子系统之一,即索引子系统,管理区域内所有 S3 对象的元数据和位置信息。该子系统是服务所有 GET、LIST、PUT 和 DELETE 请求所必需的。
本质上是知道什么在哪的服务。无论您如何设计基础设施,总会有相似之处。只需从亚马逊那里拿走它,即使是排名第一的云提供商也不敢接触该系统。
虽然这是自 S3 推出以来我们一直依赖的一项操作来维护我们的系统,但我们多年来并没有完全重新启动我们较大区域的索引子系统或放置子系统。
如果你把他们的博客读到最后,他们没有实际的解决方案。他们只是想减少它再次发生的机会。总会有一些关键点,您不能进行冗余——或者在该区域进行冗余成本非常高。
最后,让服务停止运行并等待三大云提供商将其恢复可能会更便宜。