筆者單位新部署了PSC(Platform S e r v i c e s Controller)架構 的vCenter,原計劃將一組由6臺主機構成的vSAN集群,變更到新vCenter,按照過去的經驗,只需要確保取消了vDS和存儲策略,或先創建好一致的配置,就可以直接在新vCenter下,建 好 vSAN集群,逐個添加主機即可順利完成。然而,墨菲定律總是如影隨形,我竟然還沒在新vCenter下創建集群,也沒有添加主機,就把舊vCenter上的vSAN集群刪除了,這一切的發生是那么的鬼使神差,一點猶豫都沒有的 點下了確定。
看到集群就這么從vCenter中消失了,腦子忽然驚醒過來,然而已不可挽回,同時,立即感受到,集群中的虛機失去了響應,表現為不可操作,他們的網絡并沒斷,虛機狀態也是開啟,但所有服務都不可用,有如石化了一般。
遇到突發情況,大腦的運轉也提了速,立馬浮現出兩個處置辦法。第一是在原vCenter上創建同名集群,逐個添加主機進行恢復;第二是在新vCenter上創建同名集群,逐個添加主機進行恢復。兩者相比較,后者可以一步到位實現VC變更計劃,但不能確定其他的潛在影響。權衡之下,還是在原VC上進行恢復,待穩定后再考慮變更。
立即在原VC創建同名集群,開啟vSAN功能,然后直接在集群中添加主機,待6臺主機全部添加完畢,觀察虛機都保持之前的電源狀態,但虛機依然不可操作,檢查集群和主機的告警信息,發現6臺主機,都共同顯示一條警告:主機無法與已啟用vSAN的群集中的所有其他節點進行通信。
看到這條告警,情緒上還是保持樂觀和淡定的,因為這個告警信息在以前的運維中也遇到過,但心里也隱約有不詳的預感。……