VMware tips & tricks número 15: VMware HA y el split-brain
Un fallo en la red del Service Console, puede causar lo que se denomina split-brain, es decir, el servidor Vmware ESX funciona perfectamente pero ha perdido la conexión con el resto de nodos en el clúster – se ha perdido la conexión por donde VMware HA envía los paquetes de hearbeat.
Por defecto, la configuración de VMware HA en vSphere 4.0 en caso de aislamiento de un nodo, deja las maquinas virtuales encendidas.
Con dos «Service Console ports» y dos tarjetas de red para el heartbeat, podemos minimizar el problema del split-brain. El log de VMware HA puedes encontrarlo en el directorio: /var/log/vmware/aam/vmware_nombreservidor.log
Recuerda que VMware HA espera 15 segundos antes de decidir si el nodo se ha aislado del resto.
Moraleja; Crea un network team con dos NICs físicas y dos Service Console Port para evitar que la caída de una de las tarjetas de red física provoque que el servidor que forma parte del cluster HA se aislé.