发送内容为 0x0000 的 10 分钟的 0 间隔 MTU 大小的 DF ping 和内容为 0xffff 的第二次测试是对简单传输技术施加压力的绝佳方式。丢失的数据包——或者在前几个数据包之后过度延迟的数据包——清楚地表明需要进一步调查。这也是检查报告的往返时间是否在合理范围内的好时机(传输提供商很容易提供穿越国家和返回而不是穿越城市的电路)。
Ping 非常适合查找故障。但是,单靠 ping 并不是确定没有故障的很好的验收测试。这个答案的其余部分解释了原因。
作为 ping 测试的一部分,您应该连接路径上的每个网络元素(主机、交换机、路由器),并在开始之前和结束之后记录传输流量和错误计数器。任何类型的上升错误计数器都需要进一步调查。不要忽视错误计数器的小幅上升:即使是低丢失率也会破坏 TCP 性能。
这仍然不是说链接是可以接受的。让我们以单模光纤上的 1000Base-LX 以太网为例。接收器的光照水平可能低于该收发器型号的规范。但是我们有一个高于平均水平的收发器样本,所以一切都很好。但是后来那个收发器出现了故障,我们用低于平均水平但在规格范围内的样本替换了它。即使我们修复了故障,链接也无法恢复服务。因此,作为验收测试的一部分,我们需要检查两端的光照水平是否符合规范;并且我们需要检查在发送和接收收发器性能的极端情况下是否存在可行的功率预算(为了使这变得容易,制造商将给出他们已完成功率预算计算的 SFP 标称范围,例如 10Km 用于 1000Base-LX/LH。但是对于任何超过 10 公里的链路,您应该自己做功率预算:五分钟算术可以为您节省数百美元,让您可以安全地购买低功率 SFP)。SFP 通常具有“DOM”功能,可让您从设备的命令行检查接收光级别。
更复杂的传输技术具有前向纠错功能。因此,链路似乎在高传输错误率下工作,但如果错误率更高或更持久,则 FEC 不堪重负,传输将通过垃圾。因此,对于这些链接,我们对纠错次数非常感兴趣。解释这些 FEC 计数器需要了解物理传输,因为我们现在在“堆栈”中足够低,我们不能再假装媒体不是自然没有错误的。但即使在这些系统中,简单的 ping 测试也足以提供初始结果。
最后,您应该意识到 PC 是一种廉价但并不完美的测试平台。所以有时丢包是因为终端系统而不是传输。这可能是简单的 IP 层问题(例如 MTU 与子网不一致,当主干链路应以 MTU > 9000 运行时总是可能的)或主机性能问题(特别是 > 10Gbps)。“真正的”以太网测试平台的成本非常高,因为您要为通过硬件或智能软件(例如,在 NIC 内运行)完全分类的问题付费。