cisco 接口上的总输出下降

网络工程 思科 转变 错误
2022-02-07 00:54:10

我们有 c3850 中继与其他交换机 4948 及其 4 个 1G 中的 LACP 4x1G 接口绑定(etherchannel),我们正在Total output drops使用 2 个接口。

这一切都是昨天开始的,当时我在这个交换机上升级了软件,然后一切都很好。没有意义。我已经在其他交换机上完成了此升级,但到目前为止没有问题。

C3850#sh int g2/0/1
GigabitEthernet2/0/1 is up, line protocol is up (connected)
  Hardware is Gigabit Ethernet, address is 1c1d.86a9.3501 (bia 1c1d.86a9.3501)
  Description: coreSW_1_W_1of4_p
  MTU 1500 bytes, BW 1000000 Kbit/sec, DLY 10 usec,
     reliability 255/255, txload 36/255, rxload 25/255
  Encapsulation ARPA, loopback not set
  Keepalive set (10 sec)
  Full-duplex, 1000Mb/s, media type is 10/100/1000BaseTX
  input flow-control is off, output flow-control is unsupported
  ARP type: ARPA, ARP Timeout 04:00:00
  Last input 00:00:11, output never, output hang never
  Last clearing of "show interface" counters never
  Input queue: 0/2000/0/0 (size/max/drops/flushes); Total output drops: 133157273
  Queueing strategy: fifo
  Output queue: 0/40 (size/max)
  5 minute input rate 100659000 bits/sec, 61038 packets/sec
  5 minute output rate 144390000 bits/sec, 76852 packets/sec
     3445318149 packets input, 715126259616 bytes, 0 no buffer
     Received 827824 broadcasts (666658 multicasts)
     0 runts, 0 giants, 0 throttles
     0 input errors, 0 CRC, 0 frame, 0 overrun, 0 ignored
     0 watchdog, 666658 multicast, 0 pause input
     0 input packets with dribble condition detected
     4521665906 packets output, 1080744400610 bytes, 0 underruns
     133157273 output errors, 0 collisions, 1 interface resets
     0 unknown protocol drops
     0 babbles, 0 late collision, 0 deferred
     0 lost carrier, 0 no carrier, 0 pause output
     0 output buffer failures, 0 output buffers swapped out

柜台:

C3850#sh int g2/0/1 counters

Port            InOctets    InUcastPkts    InMcastPkts    InBcastPkts
Gi2/0/1     718020111847     3459023952         668522         161527

Port           OutOctets   OutUcastPkts   OutMcastPkts   OutBcastPkts
Gi2/0/1    1084965964251     4539489816         109940          86365

统计:

C3850#sh int g2/0/1 stats
GigabitEthernet2/0/1
          Switching path    Pkts In   Chars In   Pkts Out  Chars Out
               Processor      10458    2249522          0          0
             Route cache          0          0      18985    2870366
                   Total      10458    2249522      18985    2870366

编辑:

我们在链接上的总利用率为 400Mbps,我看到所有链接单独使用约 100 Mbps(这里和那里的几个字节)。

我在网络上没有看到任何性能问题。此中继连接到其他交换机,并且它们也运行相同的速度接口 4x1G。我已经用相同的软件升级了多个交换机,它们都工作正常,没有任何接口错误。

2个回答

您是否注意到自升级以来性能下降?如果没有,问题可能是您一直遇到该问题,但您之前的 IOS 版本没有报告错误。

假设您正在经历性能下降。正如您所看到的输出下降,这通常意味着链路正在经历拥塞。

您可能已经知道,流量不会在端口通道中的所有链路上平均分配。例如,端口通道 4 x 1Gb 链路并不能保证 4Gb 的吞吐量。根据您使用的散列算法,流量在链接之间进行拆分。鉴于此,实际上有可能一个链接被最大化而其他链接保持休眠状态。

虽然我们讨论的是负载平衡算法,但您遇到的问题可能与CEF 极化有关。

Cisco IOS 引入了一个称为唯一 ID/通用 ID 的概念,它有助于避免 CEF 极化。此算法称为通用算法(当前 Cisco IOS 版本中的默认值),将 32 位路由器特定值添加到散列函数(称为通用 ID - 这是交换机启动时随机生成的值可以手动控制)。这会在每个路由器上使用唯一 ID 为散列函数播种,从而确保相同的源/目标对在路径上的不同路由器上散列为不同的值。此过程提供了更好的全网负载分担并规避了极化问题。由于硬件限制,这个唯一的-ID 概念不适用于偶数个等价路径,但它完美地适用于奇数个等价路径。为了克服这个问题,当等价路径为偶数时,Cisco IOS 会在硬件邻接表中添加一个链接,以使系统相信等价链接为奇数。要为通用 ID 配置自定义值,请使用:

6500(config)ip cef load-sharing algorithm universal <id>

另一个可能的原因是当您降低速度时会发生微突发(例如,1Gb 接口连接到 100Mb 接口)。如果您的接口配置为自动协商其速度和双工,请检查它们以确保它们已正确协商其设置。

你不需要LACP。把事情简单化。只需配置端口通道接口,然后将您的物理以太网端口分配给该端口通道组mode on关闭两台交换机上的端口通道接口和整个物理接口包,然后从端口通道接口开始将它们全部重新联机。那应该这样做。继续测试关闭单个链接并确保它们恢复正常。如果您有问题,请执行show int并查找errdisable. 这就是为什么我说管理员关闭它们并取消关闭它们以清除它。

我不明白你为什么需要LACP...