思科“架顶式”设计有什么好处?

网络工程 思科 最佳实践 cisco-nexus-7k
2021-07-27 23:37:18

除了您避免明显的布线混乱(我知道我们作为网络工程师很棒,但在与没有意义的人进行推理时很难用作借口),与直接通过铜线连接到更大的电缆相比,您有什么收获?核?

背景: - 价格无关紧要

  • 公司已经决定采用双 Nexus 内核。

    • 选项 1:Nexus 7004,它将几乎完全填充 10G SFP+ 并聚合连接到 DC 中每个机架顶部的多个 FEX,以及聚合 SAN 和各种服务器连接

    • 选项 2:Nexus 7009 核心,大约为 1/3 充满了各种模块,以容纳来自所有设备的所有光纤连接的聚合。

  • 这是一个托管数据中心

  • 托管在网络上的标准呼叫中心/企业域相关服务

  • 鉴于该公司是呼叫中心,QoS 是一个非常重要的要点要强调

问题:

  • 尽管我想要更少的布线混乱和更模块化的设计,但我无法证明采用 Cisco 的“架顶式”设置是合理的。我无法这样做,因为您在网络中插入了一个故障点。这样做会增加延迟(即使只是少量)等等。不仅如此,现在我想想,由于所有 FEX 都依赖 Nexus 来运行,您不仅会增加硬件故障的机会关闭一组设备,但现在是一个软件过程,它可能会以某种方式导致 FEX 出现故障。

所以,在我将机架设计的顶部放入这个项目的想法墓地之前,鉴于缺乏预算限制,其他任何人都可以看到不采用更大内核和没有 FEX 的理由吗?

4个回答

至于好处,第一根电缆会马虎,一旦马虎,就会出现问题。我已经看到数据中心的基础设施布线由于多种原因而变坏。需要更多电缆?然后有人在弄乱电缆设备,可能会损坏某些东西。处理插入设备的近 400 根电缆会导致比 48 根更多的意外断开连接。管理起来要容易得多。

其次,这有助于未来的证明。虽然有 10Gbps 铜线,但距离限制可能会因情况而异。此外,使用时间越长,10G 铜线往往会消耗更多功率。

第三,可以更轻松地更换 FEX。想要从 1Gbps 铜线切换到 10Gbps SFP+,只需更改 FEX。您的核心保持不变,配置基本保持不变。

我没有看到你提供的负面影响,只看到这样做的好处。

根据您的数据中心设置,我会在机架顶部使用两个结构扩展器或一个(如果服务器可以与相邻机架共享)。服务器应连接到两个独立的扩展器。每个结构扩展器都可以通过 FET 连接到两个 Nexus 7k(也应该连接)。

这应该会减少您失败的机会。FEX 是机箱的扩展(专为具有高 MTBF 的数据中心而设计),更类似于 1U“主体”中的模块,而不是二级分配或接入设备。他们引导他们从核心引导软件,因此没有软件差异。您可以在任何地方丢失 7k 或扩展器而不会丢失服务。可能是 7k 和一些扩展器而不会丢失服务。

然后,您还可以将其作为单个逻辑单元进行管理,允许服务器之类的东西即使在连接到两个不同的扩展器时也可以实际进行链路聚合,既提高了性能又降低了失败的可能性。

我看不出这将如何以任何方式增加延迟,它实际上可能会改善它。

当你开始使用 Nexus 更高级的功能时,我只能看到更多的好处。

最终,您需要根据自己的需求做出选择。但我要说的是,如果你研究顶级互联网公司如何运行他们的数据中心,你会发现大多数都有某种架顶式部署。他们不选择这个是因为这会增加他们的停机时间或降低性能。他们这样做是因为它减少了停机时间,提高了性能,并大大提高了可管理性。

编辑:从我的评论中合并,以便我可以删除。目前此答案的评论序列太长而无用。

请记住,FEX 本质上是一种扩展结构的方法,因此得名。集中管理同时仍然在整个 DC 中分布“线路卡”的能力是使用 FEX 的真正原因。大幅减少布线对任何人来说都是有价值的,无论技术与否,能够在更少的点管理整个基础设施的论点是节省时间,纯粹而简单。

您最大的疑问之一是您担心单点故障。所有设备都具有双宿主能力,在某些配置中,您甚至可以与 Nexus 2K FEX 本身建立虚拟端口通道。

查看Cisco 的文档您会发现您可以设计一个与您正在考虑的“直接电缆”选项一样冗余的拓扑,而无需大惊小怪。

1.) 如果您在 Colo 空间中,很可能希望看到 7010 具有前后气流,而不是 7009 侧向气流。

2.) ToR 与集中式交换讨论中的一个明显点通常是可扩展性。如果您的 colo 足迹几乎是固定的,那么就不必担心。如果它计划以任何可观的方式增长,那么应该考虑以合理的方式扩展网络的能力。也就是说,如果担心增长,我可能不愿意使用 7004 作为 FEX 单位的集中点。7K 目前可以运行到 48 个扩展器,未来可能会更高。但是,如果您打算在此期间使用 6 个机柜,那么两种方式都没有关系。

3.) 这里的未知数(至少基于最初的问题)是机架中服务器的密度。如果是 6-8 个 4U,那么 FEX 就大材小用了。如果是来自 1U 或刀片直通的数十个 GE 链路,则布线争论将变得更加严重。我见过某些(功能失调)设置,将 384 条以上的电缆连接到单个机架。这不是我想再次看到的。

总而言之,托管一堆 FEX 单元的小型 7K 与运行这些相同连接的大型 7K 家庭之间的主要区别在小规模上不会很大。如上所述,FEX 只是作为机箱上的另一个线卡出现。除了极少数例外,FEX 端口的特性和功能将等同于本地端口,并将按原样进行管理。

此外 - 与普遍怀疑的相反,如果设计正确,使用 FEX 的性能损失并不重要。关于延迟的争论以微秒为单位(如果这是一个问题,那么整个设计最好使用不同的平台来解决)。

将电缆直接连接到核心,或在两者之间使用结构扩展器之间没有太大区别(除了成本)。

  1. 如果您将服务器直接连接到核心,您将使用两条链路连接每台服务器,一条连接到每个核心交换机。这样,即使一个核心交换机出现故障,另一台也能保持服务正常运行。
  2. 如果在每个机架顶部使用光纤扩展器,您的服务器通过两条链路连接到两个不同的光纤扩展器,这两个光纤扩展器都连接到两个核心交换机。FEX 和核心交换机之间的链路是 L1 链路,整个交换矩阵扩展器设置作为单个逻辑交换机运行。该设置不会引入额外的 STP 节点,因此不应有比第一个选项更多的延迟。对于连接丢失,两个核心交换机或两个 FEX 或其相应的链接都应该出现故障。单个 FEX 或核心交换机的故障不会影响服务。虽然 Fabric 扩展器是一个相对较新的想法,但其工作方式实际上比选项 1 更好。

由于您提到预算不是问题,因此您可能希望调整 Nexus 7K(和光纤连接)的大小,使其具有足够的容量来支持未来升级到 40G 或 100G。可以安装 FEX 以满足当前的要求。稍后,如果您想升级到 100G,您只需更换 FEX,而无需更改您的 Nexus 7ks 或布线。