如何避免微爆造成跌落?

网络工程 转变 以太网 hp-procurve 阿鲁巴岛
2022-02-28 03:27:54

我有一个与微爆有关的网络问题。我将首先介绍一下网络:

有 4 个 Aruba/HP ProCurve 开关。1 个核心交换机和 3 个下游交换机。此网络中的所有连接都是 1 Gbit/s 连接,但与服务器的连接除外。服务器以 2x 10Gbit/s 连接到核心交换机。

在多个位置,有客户端从服务器流式传输视频数据。加起来平均 1Gbit/s 的带宽就足够了。不幸的是,我注意到核心交换机上的 1Gbit/s 下行连接总是有掉线。我认为微爆在这里可能是一个问题,而且是正确的。我用wireshark测试了它(你可以在这里看到I/O图:https ://www.dropbox.com/s/fcvvqevv32i8wdy/wireshark_D2B607E8-6C5C-41CD-8539-58F35C6A2FFD_20180725140635_a08312.png?dl=0 )

在服务器上跟踪了 wireshark 的输出。在图表的第一部分,您可以看到我将一个受影响的下游端口镜像到服务器的突发。第二部分(没有大爆发)看起来不同,因为我在跟踪运行时停止了镜像。问题是我不知道如何阻止这种爆发和由此产生的下降。我尝试稍微调整一下服务器网卡的设置(缓冲区大小等),但我没有遇到此类问题的经验。我不想做的是将服务器连接到 1 而不是 10 Gbit/s。

我希望在这里找到一些想法。

1个回答

服务器和客户端之间的网络变得太薄太快。虽然服务器可以向每个客户端交换机发送超过 1 Gbit/s 的数据,但这些交换机上行链路是瓶颈——链路上超过 1 Gbit/s 的数据会导致流量下降。

您的图表显示了在核心交换机内缓冲过多容量的突发。您应该检查交换机统计信息以确保。您需要调节流以减少带宽(很难甚至不可能)或增加核心交换机和下行链路交换机之间的带宽。

最佳解决方案是到每个下行链路交换机的 10 Gbit/s 链路。次优是聚合至少两个 1 Gbit/s 链路。由于链路聚合不提供适当的负载平衡,您可能需要两个以上的链路。

编辑: 作为最后的手段,您可以激活核心交换机和服务器 NIC 上的流量控制。当核心交换机中的出口缓冲区填满时,流控制会生成暂停帧。这些会导致发件人在短时间内停止传输。这会将缓冲移至服务器并可能会有所帮助。