Cisco 6500 VSS 会改善还是损害 MTBF?

网络工程 思科 对决
2021-07-25 17:53:41

我了解 Cisco 6500 VSS 的优势,它具有单一管理、单一路由实例、STP 消除、跨机箱端口通道等明显卖点。有两个独立的 Cisco 6500,它们之间可能有 L3 和 L2 端口通道,它们至少在控制平面上没有相互依赖。

在 VSS 世界中——我没有这方面的直接经验——我们现在拥有控制两个交换机的软件和其他协议。在我期望控制平面软件存在错误的设计中,VSS 是否会像我怀疑的那样降低 MTBF,是对获得的功能的权衡,还是我错过了 MTBF 的改进方式?

3个回答

答案的简短版本:两者都有一点,但它并不意味着是一种直接提高可用性的技术

答案的长版:正如其他人所指出的,制造商对 MTBF 和可用性的传统定义侧重于硬件故障。其他因素——人为错误、有缺陷的软件、计划维护等——是开发架构时的考虑因素,但都是在个人用户级别进行的。

从硬件角度来看,VSS 不会影响可用性。使用的是相同的硬件,因此使用相同的 MTBF/MTTR 数字并且最终可用性方程相同。

从更全面的角度来看,这确实是一种折腾,在很大程度上取决于您的个人需求。一方面,您可以认为它不太可靠,因为它是一项复杂的技术,并且单个“虚拟故障点”(即 VSS 控制平面)将影响两个冗余设备。另一方面,它可以被视为提高可用性,因为单个虚拟设备使网络变得更加简单,使其不太可能出现其他问题(需要管理的设备更少,没有 HSRP/VRRP,非循环 STP 域,更简单的 L3 拓扑等)。

市场几乎已经表明,大多数网络工程师将 VSS 和类似技术视为对传统 L2 发行版/访问拓扑的改进,但您还可以采用其他技术。例如,路由的 L3 接入层可以实现 VSS 的大部分优势,但 VLAN 将无法跨越多个接入层设备,这使得该解决方案在某些情况下(例如,虚拟化数据中心)可能毫无用处。

从功能的角度来看,VSS 基本上采用两个机箱并在单个控制平面上运行它们。如果您想创建一个 18 插槽的 6500,那么它是理想的技术。如果目标是更高的可用性,则很难证明其合理性。他们的关键在于,在建立 VSS 对时,您已经创建了一个单一的功能机箱。控制平面上的任何故障模式——从软件缺陷到配置错误——都会对整个综合体产生直接影响。

值得一提的是,在过去的五年里,我并没有真正看到很多 VSS 的新部署,但我看到了相当多的人已经删除了该功能,以支持运行独立的 6K 对。

我的经验是 VSS 通过降低操作复杂性(即没有 HSRP/VRRP、更少的 STP 调整、更简单的路由等)来延长 MTBF,尤其是对于工程师经验不足的商店。链路故障后的重新收敛通常更快,因为网络的其余部分从 L2 和 L3 的角度将这对设备视为一个设备。我的猜测是,与 VSS 软件错误相关的中断比通常在该层运行的各种协议的交互和故障模式造成的中断要少。

其它你可能感兴趣的问题