开关无法访问然后自动访问

网络工程 思科 路由 转变 交换
2022-02-28 21:58:09

我目前面临的问题是,对于远程站点,很少有交换机无法访问,然后在某个时间(可能是 1-2 天)后可以从子网的特定 IP 访问,而始终可以从同一子网的另一个 IP 访问。

场景:
有一个远程站点通过 WAN 链接连接到我们的主要位置,该链接终止于站点的核心路由器。路由器后面有一个核心交换机,其他交换机在核心路由器后面。NMS 服务器的可达性下降,而这些交换机可以从具有来自同一子网的 IP 地址的另一台服务器访问。一段时间后,交换机变得可以访问并再次变得无法访问。

以下是两台服务器的输出:

从服务器 A

C:\Users>tracert 11.11.0.123

Tracing route to 11.11.0.156 over a maximum of 30 hops
  1     5 ms     7 ms     3 ms  172.16.9.1
  2     7 ms     3 ms     7 ms  172.16.57.2
  3    18 ms    19 ms    19 ms  172.16.30.218
  4    19 ms    19 ms    19 ms  11.11.0.123
Trace complete.

从服务器 B [NMS]

[root@localhost ~]# tracepath 11.11.0.156
 1?: [LOCALHOST]                                         pmtu 1500
 1:  gateway                                               0.591ms
 1:  gateway                                               1.995ms
 2:  172.16.57.2                                          2.033ms
 3:  172.16.57.2                                          1.862ms pmtu 1476
 3:  172.16.30.218                                       13.858ms
 4:  no reply
 5:  no reply
 6:  no reply
^C

/////////从开关///////////

HOUSINGOFFICE#traceroute 172.16.9.101

Type escape sequence to abort.
Tracing the route to Server B [NMS]

  1  *  *  * 
  2  *  *  * 
  3  *  *  * 

Tracing the route to Server A

  1 11.11.0.1 0 msec 0 msec 0 msec
  2 172.16.30.217 17 msec 9 msec 16 msec
  3 172.16.57.1 17 msec 9 msec 17 msec
  4  *  *  * [Trace is completed]

以下是从交换机到 NMS 可达的跟踪信息: Switch to Server B [NMS]

Tracing the route to Server B

  1 11.11.0.1 4 msec 4 msec 0 msec
  2 172.16.30.217 12 msec 12 msec 12 msec
  3 172.16.57.1 12 msec 16 msec 12 msec
  4 172.16.9.101 16 msec 16 msec 16 msec

从服务器 B 到交换机

[root@localhost ~]# tracepath 11.11.0.111
 1?: [LOCALHOST]                                         pmtu 1500
 1:  gateway                                               2.250ms
 1:  gateway                                               4.085ms
 2:  172.16.57.2                                          1.753ms
 3:  172.16.57.2                                          2.580ms pmtu 1476
 3:  172.16.30.218                                       14.146ms
 4:  11.11.0.111                                           19.797ms reached
     Resume: pmtu 1476 hops 4 back 4

网络图(来自评论): 网络图

1个回答

当相关交换机后面的设备可以访问并且交换机可以在本地访问时,这实际上可能只是一个路由问题。

仔细检查有问题的交换机上的默认网关(静态或 DHCP)以及交换机是否可以 ping 路由器(反之亦然)。还要检查可能涉及的防火墙/VPN 规则(我假设“远程”是指通过 VPN 链接访问)。

不太可能的场景是ARP缓存中毒(在交换机或核心路由器上),流氓DHCP服务器更改交换机的默认网关,通过SNMP在交换机上进行路由操作,......这些可能需要一一排除,而问题发生。一个简单的跟踪路由不会产生足够的信息。