Windows Server企業版內置所提供的集群特色,一直以來始終是大多數企業IT在高可用性部署需求上的最愛,其原因很簡單,不外乎是簡易部署與管理的特色吧。而如今全新的Windows Server 2008所提供的集群角色功能,整體設計更是要讓您嘆為觀止。
相對于前一版Windows Server 2003 R2的集群架構布署,在Windows Server 2008中可以讓管理人員更輕松地完成集群的配置工作,包括以下幾點。
在容錯集群的各節點安裝前,如果管理員已經完成了從系統、儲存設備以及網絡的配置之后,便可以使用系統提供的集群檢驗工具,來進行安裝前的各項測試,以便確認集群配置是否可以順利完成。這個測試工具進行的類別測試項包括了以下三個重點。
(1) 系統配置測試
通過欲加入集群各節點主機的系統配置測試分析,可以預先得知各節點主機是否符合加入集群架構的要求,例如它將會檢查這些節點的主機是否有相同的操作系統版本以及軟件的更新。
(2)網絡測試
通過所連接網絡的各項測試分析,可以快速得知這些網絡配置是否符合集群網絡的需求,例如它會測試目前是否有連接雙網絡卡,以及是否正確設定了各自子網絡TCP/IP的配置。
(3)儲存設備測試
通過連接儲存設備的測試分析,可以讓系統預先得知這些設備是否符合配置集群的要求,例如它會通過相關SCSI的命令來模擬集群運作的正確性。
集群安裝向導的改善,大幅簡化了整個安裝流程,并且還可以讓管理人員進一步將整個安裝設置的步驟寫成Script,以便在后續進行全自動化的布署操作。
在集群軟件的管理中,同樣包括了一個向導工具,可以協助管理人員從目前正在執行的Windows Server 2003集群,取得資源群組的各項設定,以及套用它們到正在執行的Windows Server 2008集群架構下,讓管理員可以采用最快速的方法完成集群架構的移轉。
改良設計后的集群架構,協助管理員最大化服務與應用程序的可用性,以下說明關于這部分的兩個重點。
在改良設計的集群架構設計中,你可以使用兩種不同的集群模型來建構,分別是仲裁資源模型(Quorum resource model)以及多數節點組合模 型(Majority node set model)兩種,在此舉個例子,我們可以讓仲裁磁盤發生了無法使用時,集群的執行仍然可以繼續運作,只要集群配置數據庫的副本在兩個節點主機中維持在可用的狀態下即可。
關于這部分的改良設計可以用兩個示例來說明。首先是在處理集群資源部分將用獨立運作的DLL來完成執行,對于一些失敗的操作,將使得對于整體的影響縮小到最小范圍。另一個示例則是在集群的運行中,將會以增強后的執行方法,來確保集群配置數據庫副本之間的一致性。
相對于前一版的服務器集群,在這個版本的管理中對于儲存設備的維運上,將可以獲得優化的控管機制與執行效率,這部分可以由以下四點來說明。
管理員可以在集群運作的狀態下,針對已在線的資源直接修改來附加其他的資源,也就是可以在不需要中斷集群應用程序的執行下,直接加入附加的磁盤資源。

圖1 基本雙節點集群架構
當一個容錯集群與所連接的SAN或DAS進行通訊時,系統將會使用一些破壞性的命令來進行,以避免SCSI總線發生重置。磁盤的運作是絕不會處在未保護的狀態下,目的在降低扇區損毀可能的風險,而在Windows Server 2008的容錯集群中同樣也支持了針對磁盤的探索與復原的方法。
采用GPT(GUID Partition Table)分割區格式,可以讓單一磁盤分割區的大小超過2TB(Terabytes)的限制,且每個磁盤上可多達128個磁盤分割,在信息儲存上也不像傳統MBR磁盤分割的磁盤,平臺作業不可或缺的數據必須是位于磁盤分割中,而不是位于未分割或隱藏的磁扇區中。此外,GPT磁盤分割有改良的磁盤分割表。
由于改善了在集群資源管理中的維護模式(Maintenance mode) 功能設定,因此可以在更短中斷集群運作的情況之下,讓管理員通過其他工具來進行檢查、修復、備份以及還原等操作。
一個容錯集群的規劃可以依照實際的企業IT需求,架構在不同服務角色的應用上,這包括文檔服務器、打印服務器、數據庫服務器、Exchange Server等,無論如何,這樣的整合都可以提供服務以及相對應用程序的高可用性。
如圖1所示,在一般最基礎的集群架構規劃中,常見的會準備一部兼容集群服務角色的共享存儲設備,來存放服務器節點所需共享的數據,在這種主動/被動節點連接的架構下,同一時間中只會有一個節點在對共享儲存設備的數據進行存取,直到發生了各種自然或人為的問題時,才會立即在最短的時間之內將雙方的角色進行替換,以便能夠繼續提供客戶端聯機存取的需求。
當然,無論所連接的共享儲存設備是SAN還是DAS,只要是使用不同的LUN,那么便可以讓多個集群架構來進行存取。下面,讓我們一起來看看以文件服務器為例的雙節點集群實戰示例。
我們從上述中的雙節點集群架構圖中,可以看到在部署前的硬件準備上,必須準備兩部PC主機搭配兩塊網卡,并且在完成內外網絡的TCP/IP設置之后,內網卡進行跳線對接(或是連接在相同的Switch Hub上),以便可以進行彼此的活動信號(Heartbeat)與服務器狀態確認,至于外網卡便是與所要提供服務聯機的客戶端與共享存儲設備在相同的網絡上。
軟件方面需求的準備:在軟件需求的準備上,首先注意在集群中的所有節點服務器,都必須采用相同版本的Windows Server 2008(32位或是64位),并且必須完成同樣的操作系統更新,例如相同的Hotfix或Service Pack。
接下來的注意事項請參考以下說明:
(1) DNS:整個集群的正常運作必須有DNS來提供名稱解析,并且必須在設置中采用動態更新(默認)。

圖2 設定Target存儲設備的聯機
(2) 域角色:所有服務器必須在相同的Active Directory域中,并且是相同的域角色(成員服務器或域控制器)。強烈建議一律采用成員服務器來進行部署。
(3)域控制器:在相同的域中最好有額外的域控制器主機(DC)。
(4)客戶端:請準備一部或多部要用來測試集群運作狀況的客戶端計算機,并且預安裝與設定好與集群服務器上有關的應用程序聯機設定。
(5)集群專屬的管理員賬戶:無論是集群初步的建立或是后續要加入新的集群結點,都需要有本地管理員群組成員(Administrators)的權限,以及擁有建立計算機對象的域權限才可以進行。您也可以直接使用域管理員群組(Domain Admins)的賬戶,因此建議額外建立一個專屬的賬戶來使用,并且使用此賬戶在集群服務的啟動上。
注意:在Windows Server 2008集群的建立中,并沒有像在前一版Windows Server一樣的集群服務賬戶的設定,而是由系統直接依照目前登錄的域賬戶來使用。
接下來介紹整個集群網絡的建立,其操作流程包括建立各集群節點服務器與共享儲存設備的聯機、安裝故障轉移集群組件、檢驗配置設定、執行建立集群向導。
首先來看看共享儲存設備的聯機部分,在存儲設備部分筆者已經預先準備好了一個第三方的iSCSI儲存設備,并且已經規劃了LUN,因此接下來只要完成各服務器節點的聯機設定即可。
首先請在控制臺中點選開啟“iSCSI啟動器”,執行后接著在“一般”標簽頁中變更一個容易記憶的啟動器名稱,然后點擊“探索”標簽頁(如圖2),點擊“新增入口”來加入iSCSI存儲設備的聯機地址(IP地址或FQDN),如果網絡中有安裝Microsoft所提供的iSNS服務主機的話,則也可以一并新增輸入(選擇性)。最后,在“目標”標簽頁中完成iSCSI儲存設備的登入即可。
注意:第一次登錄時,請勾選啟動時自動完成聯機選項。
成功完成iSCSI的聯機登錄后,我們便可以從系統管理工具選單中開啟“服務器管理員”,然后切換到“磁盤管理”節點,針對新加入的兩個集群磁盤進行初始化、分割區的建立、格式化以及磁盤代號的設定,其中只有磁盤代號需要在每一個集群節點上來設定,并且要一致,其他前三種動作只要由第一個聯機的服務器節點來完成即可。
想要進行上述四項集群磁盤的準備工作很簡單,首先在指定的磁盤上點擊鼠標右鍵,選擇“聯機”,通常在完成聯機時系統會自動詢問是否要立即進行初始化,您可以選擇立即完成初始化或是稍后再同樣點擊鼠標右鍵來選擇“初始化”。在初始化的設置中,您可以除了勾選所要初始化的磁盤之外,還可以選擇磁盤分割區所要采用的格式,一般來說,只有在磁盤大小超過2TB時,才會選擇以GPT的格式來建立,否則勾選MBR格式即可。
注意:無論如何不要將用作集群磁盤的項目轉換為動態磁盤。

圖3 選取服務器或集群
完成磁盤的初始化之后,便需要完成磁盤分割區的建立與格式化。請在磁盤的分割區上點擊鼠標右鍵,選擇“新增簡單磁盤區”,然后設置磁盤代號(例如:X),此磁盤代號在每一個集群節點上的設置必須一樣。最后,將這些磁盤分割區選擇以快速格式化成為NTFS格式即可,以此類推,完成其他磁盤的格式化與代號設定。
下面我們將Windows Server 2008提供的故障轉移集群組件,安裝在每一部欲成為集群服務器的計算機上。請在所有程序的系統管理工具下拉選單中,點擊“服務器管理員”,當然,您也可以直接在系統默認登錄時,在自動開啟的初始配置頁面中點擊“新增功能”的鏈接。
開啟服務器管理員窗口之后,在“功能”節點上選擇位于右方窗口中的“新增功能”鏈接,執行之后,在“選取功能”頁面中勾選“故障轉移集群”項目。最后,點擊“下一步→安裝”即可。
在正式進行集群的建立之前,強烈建議您先完成所有欲加入集群服務器計算機的配置自動檢驗工作,以便后續整個集群的布署過程中更加順利。自動檢查項目包括服務器系統本身、網絡及所連接的共享儲存設備,檢查是否均符合集群建立的需求。
請在第一個集群節點的服務器以管理員身分登錄之后,選擇位于系統管理工具中的“故障轉移集群管理”項,開啟之后選擇“動作”窗口中的驗證設置,接著在“開始之前”頁面點擊“下一步”繼續。
在如圖3所示的“選取服務器或集群”頁面中,直接輸入或點擊“瀏覽”按鈕,將所有要加入集群的服務器一一加入,然后點擊“下一步”繼續。
在接下來出現的“測試選項”的頁面中,如果選取了“僅執行我選取的測試”項目,那么您可以依實際環境需要,勾選測試特定的選項,不過如果是第一次進行檢驗,通常會全部勾選進行檢驗,等到萬一發生過程中有些項目沒有通過檢驗時,再完成相關調整之后,才會只針對上一次的失敗項目進行檢驗。
接著在“確認”頁面中,可以再一次確認剛剛勾選的測試服務器以及測試的項目明細,確認無誤后點擊“下一步”。進入“再次確認”頁面,將開始進行所有指定項目的測試。完成測試之后,便可以在“摘要”頁面中看到每個項目的測試結果。如果有某一項目出現失敗提示,請務點擊“檢測報告”按鈕,來查看每一個有失敗項目的描述。在預設狀態下,這個檔案會被存儲在SystemRootClusterReports中,并且在主檔名部分會自動標上當時測試的日期與時間(HTML文件格式)。
一旦確認完全通過各項檢驗的測試后,便可以正式開始建立集群主機了。請在“故障轉移集群管理”頁面中,點擊位于動作窗口中的“建立集群”,在“在您開始之前”頁面中點擊“下一步”繼續。
接下來,在“選取服務器”頁面中,直接輸入所有通過檢驗的服務器名稱,或是點擊“瀏覽”按鈕來一一加入即可,點擊“下一步”繼續。緊接著,在“驗證警告”頁面中,如果發現系統告知您硬件或硬件的設置不適合集群,即表示您前面的檢驗測試報告中至少有一個項目沒有通過檢驗,在此您如果堅持要繼續建立集群,則可以勾選“否”來跳過重新進行檢驗的程序。

圖4 設定集群名稱與IP地址

圖5 設定要建構高可用性的服務或應用程序
接下來會來到“管理集群的存取點”頁面中(如圖4),在這個頁面中,必須輸入一個目前尚未存在的集群名稱以及相對應的集群IP地址,而這一設置也會自動被加入到域的DNS記錄中,以供后續前端應用程序或客戶端的聯機使用。
在前面的操作中,我們完成了一個基本的雙節點集群的建立,往后如果您想將這個集群給予移除,只要針對該集群項目上按下鼠標右鍵,選擇“其他動作→損毀集群”即可。
完成了雙節點集群建立之后,接下來設置在集群架構中運作的服務或應用程序。首先點擊集群下的“服務和應用程序”項目節點,點擊位于“動作”窗口中的“設定服務或應用程序”。
在出現的“高可用性向導”界面,點擊“下一步”。“選取服務或應用程序”界面(如圖5)是系統默認可以選擇的服務與應用程序列表,在這里選取“檔案服務器”之后點擊“下一步”繼續。
在“客戶端存取點”頁面中,必須輸入一個準備讓客戶端聯機存取的文檔服務器集群名稱,然后設定一個尚未在目前網絡中被使用的IP地址,這一設置將會自動加入到域的DNS記錄中。點擊“下一步”繼續。
在“選取存儲設備”頁面中,針對目前可用的集群磁盤,指派一個或多個供建立文檔服務器集群使用,這一設置也可以在完成集群的建立之后再來修改。點擊“下一步”繼續。
一旦確認所設置的文檔服務器集群配置無誤之后,系統便會開始進行文檔服務器集群的建立,成功完成建立之后,回到摘要頁面,在此可以看到建立的集群信息,如果點擊“檢視報告”按鈕,則可以看到更完整的文檔服務器集群建立報告。一份完整的文檔服務器集群建立報告,可以查看到整個集群的建立過程,以及所有使用到的相關集群資源,例如新的IP地址資源、磁盤設備、共享服務等。
完成了文檔服務器集群的建立之后,我們便可以在“服務和應用程序”節點上看到剛剛新增的項目,選取之后,便可以進行相關的管理操作,例如將它進行脫機、顯示應用程序的日志信息、將此服務或應用程序移動到另一個節點、管理共享與存放設定、新增共享文件夾、新增存儲設備、新增資源以及顯示相關性報告等。
對于在線提供文檔服務器的節點(例如:NODE2),我們可以在選取之后,查看這個節點的相關信息,以及所連接的相關集群資源,并可以針對在這個節點上所有的資源進行相關的管理操作。

圖6 共享文件夾管理
接下來我們對文檔服務器集群進行相關的共享文件夾管理設置。在選擇文檔服務器集群節點之后,點擊位于“動作”窗口中的“新增共享文件夾”,系統會先開啟文檔服務器集群的檢查頁面,檢查信息包括確認服務器的可用性、查詢現有的集群磁盤區,以及查詢現有的共享設置。
檢查完成后,會開啟設置共享文件夾向導的頁面。首先設置“共享文件夾位置”,必須先選擇一個存放共享文件夾的集群磁盤,完成后點擊“下一步”。
在接下來出現的“NTFS權限”頁面,選擇是否變更集群磁盤路徑下的NTFS權限配置,如果不需要變,直接點擊“下一步”繼續,否則可以選擇“是,變更NTFS權限”項目之后,點擊“編輯權限”來進行修改。
在“共享通訊協議”頁面中,勾選SMB選項,然后輸入要在目前網絡上共享的名稱,輸入完畢之后,便可以在下方的“共享路徑”字段中,看到實際UNC的共享路徑,點擊“下一步”繼續。
接下來在“SMB設置”頁面中,設置針對這個共享數據的描述,或是點擊“高級”按鈕來分別設置聯機的使用者限制與脫機存取等設置。點擊“下一步”繼續。
在“SMB權限”頁面中,必須針對這個集群共享文件夾配置相關的訪問權限,分別有三種可以直接選取的權限配置,如果要自定義較為復雜的權限配置,可以在選取“使用者和群組具有自定義共享權限”設定之后,點擊“權限”按鈕來自行配置不同用戶與群組的訪問權限清單。
如果在目前的域中有配置分布式文件系統(DFS)的命名空間,則在接下的“DFS命名空間發布”頁面中,可以勾選“發布SMB共享到DFS命名空間”,挑選目前命名空間的上層文件夾。如果目前網絡中沒有配置DFS,則可以直接點擊“下一步”繼續。接下來可以在“檢查設定與建立共享”頁面中,看到前面所做過的所有配置,確認無誤之后,點擊“建立”按鈕繼續。一旦完成集群共享文件夾的添加,便可以在“確認”頁面中看到相關的成功信息,點擊“關閉”按鈕完成設置。
如圖6所示,在共享文件夾窗口中,可以看到我們剛剛新建的集群共享路徑,若要針對此共享文件夾進行變更,只要在“動作”窗口中點擊這個共享文件夾名稱的“內容”即可,若要刪除此共享設定,則可以點擊“停止共享”即可。
接下來您可以去嘗試通過UNC路徑的輸入或網上鄰居聯機方式,來存取這個檔案服務器的集群共享文件夾。
集群架構的應用不僅可以使用在文件服務器(File Server)的HA設計需求上,也可以運用在各種應用程序服務器,這包括了Exchange Server、SQL Server、Hyper-V等,有效解決因單點服務器故障的實時備份問題,讓企業的信息化安全運行。
在此筆者建議企業網管人員,使用集群架構的HA設計,來解決現階段各類重要服務器的備份規劃。