RSTP 故障排除

网络工程 生成树 IEEE-802.1w
2021-08-02 02:07:50

我们在一个由一个主环和几个分支组成的网络中大约有 30 个交换机(多个供应商)。几个分支可能有循环。一些交换机是启用了 RSTP 的智能交换机,大多数交换机是禁用 RSTP 的智能交换机或哑交换机。

当启用 RSTP 的交换机的直径约为 10 时,我们将在不到一分钟的拓扑更改后获得收敛时间。随着我们增加直径,收敛时间急剧增加,当直径接近 13 或 14 时达到 15-20 分钟。这看起来可能是网络回退到 STP 的情况,并且直径对于默认 STP 来说太大了开关上的设置。相同的设置被用于不同的网络,它会在几秒钟内迅速收敛。

有没有办法隔离哪个交换机可能导致网络回退到 STP?一些交换机提供有关 RSTP 状态的更多状态详细信息(例如端口是否为 RSTP/STP),但大多数交换机提供很少的诊断信息。

2个回答

15分钟收敛?哎哟! ;) 但是,是的,我同意您的怀疑 - 分散在网络中的多个 802.1D 网桥很容易导致收敛,因为它们在处于侦听状态时会阻塞除 root 以外的所有端口 - 将其乘以几个框,您将拥有随着半径的增加,相当多的拓扑状态会发生变化。

首先,如果您正在运行 STP,则需要在所有交换机期间运行它。试图诊断 BPDU 是否会被禁用 STP 的交换机转发或丢弃是一条疯狂之路。

如果您有不支持 STP 的设备,要么将它们装箱,要么将它们移到网络的边缘,在那里它们不会干扰拓扑(例如:在只有 1 个上行链路和 1 个下行链路的网络分支上)。

STP 很难大规模排除故障,因为当一切正常时实际上只有单向通信 - 例如:BPDU 仅从树的根部传出,因此很难从上游知道下游设备的状态一。我强烈建议您打印出网络的物理图(或绘制它),标记根桥然后连接到每个相邻的桥,标记出哪个是根端口(和速度)、指定端口(和速度)和每个节点的任何阻塞端口。

根据您可以从每个交换机中提取的信息量,您可能能够通过与每个接口关联的端口成本来确定 STP 与 RSTP - STP 将 1Gbps 接口视为端口成本 4,而 RSTP 将它们视为成本20,000 - 这可能会提示您有关违规开关的位置。

802.1D STP 的默认收敛时间为 50 秒。像 15-20 分钟这样的事情是疯狂的。我同意 Ron 的评论 - 听起来您的网络中需要一层分布式交换机来充当 VLAN 的 STP 根。这有助于保持良好和有序,同时确保不发生循环。