我们正在 exsi 上部署 HA 数据库集群,它基于虚拟 IP 概念进行故障转移。如果一个节点失败,保留的 VIP 将分配给另一个节点
我们在这些 exsi 节点上有两个 exsi 节点和两个虚拟机作为主节点和从节点。
db_master = 192.168.60.10
db_slsave = 192.168.60.11
reserved_vip = 192.168.60.12
gateway = 192.168.60.1
每个 exsi 节点有两个接口。使用基于 IP 哈希的路由配置的 NIC 组合,其中 LAG 配置在交换机端 (NO LACP)。
LAG 配置为中继端口,我在 exsi 端口组内终止 VLAN
我所有的数据库服务器都在 vlan 60 上,这些是目前 exsi 上唯一的虚拟机
我配置了虚拟端口组并分配了 vlan 60。并且网络启动并运行。当我移除一根电缆时,我可以 ping 设置之外的其他节点并且 LAG 工作正常。
问题与数据库故障转移有关。对于分配给 db_master 的正常场景 VIP 192.168.60.12。当我关闭 db_master VIP 将分配给 db_slave。
故障转移软件功能运行良好,但当虚拟 ip (192.168.60.12) 分配给 db_slave 时,我无法再从网关 ping 它。
看来这是arp问题。但我想通过影响故障转移来确认基于 exsi IP 哈希的路由和延迟不会在这里出错。
此外,我没有用应用程序级别检查这个,而只用 ICMP