使用vCenter Server可以對ESXi主機進行集中管理,但有時會出現ESXi主機和vCenter服務器連接不順暢時斷時續的問題。一般情況下,vCenter服務器和目標ESXi主機建立從屬管理關系后,vCenter服務器會接收來自ESXi主機上管理網絡端口的心跳信息,使用的端口為UDP 902。這樣,可以確認ESXi主機是否處于正常狀態,還可以為HA功能做好準備。因此,如果上述UDP 902通訊端口出現問題,就很容易導致上述故障的發生。
當然,這可能有多方面的原因引發,例如當vCenter服務器上開啟了Windows防火墻,并且防火墻規則禁用了該端口。如果vCenter服務器沒有使用該端口來發送和接收心跳信息,而且ESXi主機Block阻塞了該端口,當ESXi主機和vCenter服務器之間的通訊線路出現擁塞等等,都會導致上述故障的發生。
了解了故障原因之后,就可以有針對性地解決問題。例如,在vCenter服務器上檢查防火墻規則,來清除屏蔽該端口的項目,或者將防火墻關閉等。在vCenter服務器上檢測是否啟用了UDP 902端口,可以使用PuTTY等工具連接到ESXi主機上,執 行“less /etc/vmware/vpxa/vpxa.cfg”命 令,在該配置文件中檢測是否存在“”一行,如果有的話,就要求vCenter服務器上也必須存在對應的配置信息。在vCenter服務器上打開“Heartbeat.xml”文件,在其中檢測是否存在“
當vCenter服 務 器和ESXi主機之間網絡通訊過于擁堵,很可能導致HeartBeats包被丟棄,可以使用多種網絡流量分析工具,來監控實時網絡通訊信息。例如在EXSi主機上執行“tcpdump-uw -i vmk0”命令,來查看指定虛擬網卡的流量信息等。或者干脆更換新的物理交換機,以及將vCenter服務器作為虛擬機,運行在ESXi主機中,在不跨越VLAN的情況下,可以大大降低故障發生的可能性。當使用vSphere Web Client來管理ESXi主機時,有時會出現目標ESXi主機無響應,造成無法管理的問題。該情況經常會出現在使用分布式虛擬交換機的場合中。
分布式交換機存在兩層結構,包括I/O Plane和Control Plane。前者主要用于實現I/O傳輸,用于和虛擬機的數據通訊。對于后者來說主要實現vMotion接口、管理接口、存儲連接接口等功能。由于分布式交換機的連接穩定性或者連通性導致上述問題的發生,可以在DCUI界面下選擇“Netware Restore Options”項,并選擇“Restore Network Settings”項,重置網絡設置,管理網絡會自動重置到標準虛擬交換機上。當然,這就導致之前網絡配置參數的丟失。當故障排除后,可以恢復之前備份的分布式虛擬交換機配置信息。實際上,對于虛擬交換機的管理,最好從架構上進行優化,來規避這些問題,例如一臺標準虛擬交換機負責管理方面的業務,一臺分布式虛擬交換機承擔虛擬機通訊業務等。