避免ARP广播风暴

网络工程 转变 以太网
2021-07-28 07:24:40

前几天我们遇到了一个问题,我们的一名员工无意中将一个廉价的交换机(没有 STP)双重连接到另一个禁用了 STP 的交换机。(第二个交换机连接到我们的主网络。)由此产生的数据包风暴导致我们的网络瘫痪。

如果我们简化的网络拓扑看起来像这样

.--.
|S1|
'--'
  |
.--. ___ .--.
|S2| ___ |S3|
'--' '--'

(对不起,粗略的 ascii 艺术,我试图说明 S2 和 S3 连接了两次,创建了一个桥接循环)

  • S1实际上是思科交换机的机架
  • S2 是禁用 STP 的 Netgear 智能交换机
  • S3 是一个没有 STP 的嵌入式交换机

这个区域不是我的强项,所以我什至不确定这是否可能,但是如果我们的网络看起来像这样,有没有办法保护 S1 免受 S2/S3 之间随之而来的广播风暴的影响?

更新更多信息:

  • 机架式 Cisco 交换机混合了 SG200-50、-26 和 -18
  • Netgear 是 GS108Tv2 运行固件 v5.0.5.7
  • 更深奥的设备是工业控制器中的小型嵌入式开关,链接在这里:https://www.phoenixcontact.com/online/portal/us?uri=pxc-oc-itemdetail:pid=2891001&library=使用&pcck=P-08-08-10-06-01&tab=2。PDF(下载选项卡)表明了一些关于“多地址功能”的信息,但我认为这不是 STP/RSTP。

感谢您到目前为止的所有答案。对此,我真的非常感激。

3个回答

另一个禁用 STP 的交换机

我不需要再读更多了。医生,我做 X 的时候很痛…… ” 显然,你不应该在任何支持它的东西上禁用 STP,以免发生这种情况。但是,考虑到您的拓扑结构,STP 应该已将 S1-S2 链路分开。但是看到这些是带有 Cisco 徽章的 LINKSYS 交换机,我不希望他们正确处理这个问题。我也不指望 Netgear GS108T——一个便宜、简单的开关(我有几个)——有强大的风暴控制。

真的唯一可以说的是“不要那样做”。(其中“那个”等于(a)“禁用 STP”和(b)“将开关插入自身”。我不能让你做这些事情中的任何一件。而且你不能确定其他人不会做(b)。 )

我不想听起来像是在推动更昂贵的 Cisco 交换机,但是当有人配置虚拟负载平衡器(alteon,如果您关心)时,我的 VMware 实验室中时不时会出现相同类型的情况在同一个网络中有两个接口。我们的 Cisco 2960S 立即终止该端口 - errdisable 自环端口。

在这里同意 Ron 和 Mike Pennington 的观点。生成树的全部意义在于防止广播风暴炸毁您的网络,您最近刚刚观察到有关如何发生的实践课程。

了解您的 Netgear 交换机的版本会有所帮助。我正在查看 GS748TS 的旧版 ProSafe 开关用户手册,并且生成树设置非常精细,因此您应该能够配置开关以防止将来发生此类事情。

在较旧的 NetGear ProSafe 交换机上,我使用的默认配置是在 RSTP(快速生成树)中启用 STP,BPDU 泛洪到交换机上的所有端口。这是日常使用的好配置。为了给您提供更多帮助,我们需要知道您的网络上有多少个 VLAN,等等。

但归根结底,这是一个沉重的教训,需要制定公司政策来管理可以和不可以连接到生产网络的内容。在我的雇主(一家大型财富 500 强制造企业),我们的网络政策是交换机上的所有访问端口都配置为启用 BPDUguard,这样当任何未知的交换设备插入其中时,端口都会被错误禁用。如果您的交换机上有 SNMP 监控,那么您将收到警报。

用户感到沮丧需要付出很小的代价,但这完全可以弥补,因为您将自动拥有可见性并希望控制连接的内容,并且您将来不必处理网络中断.

我遇到了一个问题,这些问题会导致我们的整个网络瘫痪。6 台极限堆栈、3 台 HP 交换机各种型号和至少 8 台这些 netgear gs108 的 Gs108T 没有打开生成树,它们自身循环并连接到除开启 ELRP 的极限交换机之外的任何交换机,最终将导致整个网络瘫痪。它看起来像广播风暴或组播风暴。我有一台笔记本电脑连接在跨接/镜像端口上,你会看到有很多 dup-ack 和 tcp 重传数据包通过网络传输有问题的设备或个人电脑。我建议看看它为自己做什么是打开mac地址跟踪并观察会发生什么。网件基本上会成为网络黑洞。当我执行这个实验来弄清楚为什么我看到一个循环并且生成树没有处理它时,我惊恐地发现网络上的所有 mac 地址都开始从一个交换机移动到另一个交换机,最终转移到了 netgear。我发现 ELRP 可以检测到循环,因此我将其打开以帮助防止再次发生这种情况。这使我们公司在停机时间和更换几个交换机以及前往阿拉斯加一周进行故障排除方面花费了很多钱。

选择这些开关来代替愚蠢的 netgear 开关。在关键环境中部署它们之前要三思。一个人插上一个不配置就可以搞垮整个网络。顺便说一句,他们在所有端口上都关闭了生成树