我在一个数据中心的链接有一个非常奇怪的问题,我正在寻找一些我还没有找到的其他解决方案。我们有一个基于 Cisco Nexus 3K 的网络,并且脊/叶之间的大多数核心链路都有 FCS CRC 错误。我之前在不同的网络中遇到过这些问题,并且使用不同的电缆或光纤进行修复总是很容易。现在我排除了所有典型的 L1 问题,但我仍然有这个问题。
所以,
- 改变了纤维
- 更换了光学元件(10G LR)
- 改变了交换机端口
- 将纤维清洗干净,用显微镜检查,超净
- 我们在多个交换机上遇到问题
- 有问题的链路是没有接线板的 2 米直接 SMF 电缆,而且在 ~1KM 路径上。两者都在 1310nm 双工以及双向 10G u/d 光学器件上。
现在,我绘制了每秒的错误率,我注意到所有图表的形状都相同。当一个机架的错误率上升时,另一个机架的错误率也会上升。奇怪的是,有 2 片叶子没有问题。配置几乎相同。所有链路都是 L3 路由端口。交换机在最新版本 (7.8) 上运行。目前还不清楚用户体验是什么,但在我看来,几周内出现 100.000 个 CRC 错误是不正常的。
以前有没有其他人遇到过这种情况,你的解决方法是什么?
非常感谢!