姜娜娜,王 凡,崔 巍,陳增境
(中國氣象局旱區特色農業氣象災害監測預警與風險管理重點實驗室,寧夏750002)
部署國內氣象通信系統CTS2.0省級單機版的目的是當省級CTS2.0業務集群整體出現重大故障且短時間內無法恢復時,由省級CTS2.0單機版承擔核心數據交換業務,保障核心業務的正常運行。國內氣象通信系統CTS2.0省級單機版支持全部業務的切換以及單獨文件傳輸、消息傳輸和雷達流傳輸業務切換,切換操作采用負載均衡虛擬服務IP組地址切換實現。
寧夏國內氣象通信系統CTS2.0單機版位于省級寬帶網區,由兩臺服務器構成AB機形式,通過主備兩臺負載均衡設備實現數據收發處理的負載分擔。
單機版服務器具有512 GB內存及千兆網卡,操作系統采用SUSE Linux Enterprise Server 11 SP4;單機版相較于集群版無需掛載磁盤陣列而只使用本地磁盤代替磁盤陣列,即只在本地掛載data、beyc、mosdb 3個數據分區,具體劃分方案如表1所示。

表1 單機版磁盤劃分方案
單機版不需要安裝集群軟件,應用軟件的啟停均通過手動方式啟動腳本[1]。單機版包含寧夏省級CTS2.0業務集群全部應用,由AB機分擔,AB機均部署全部的應用,但應用在AB機時需分別啟動。
在root用戶下分別在AB機解壓安裝包,執行安裝腳本。安裝完成后為保證業務的一致性,還需要在單機版同步業務集群FTP賬戶配置、質控程序(qc0txt、qc0bufr、qc0bufrupar)、雷達流配置、業務入口目錄、業務收發策略(SchedulerData.xml、cts0.db、cts_new.db)、數據庫配置(表結構、事件和存儲過程)和日志網關配置等相關信息。應用部署完成后按照應用清單的順序分別在2臺服務器啟動相應應用進程并進行檢查。
因為寧夏采用主備兩臺負載均衡設備實現數據收發處理的負載分擔,因此還需要提前進行消息應急傳輸,雷達流應急傳輸和文件應急傳輸負載均衡配置,從而實現通過負載均衡虛擬服務IP組地址切換方式,由CTS省級單機版快速接管業務。
數據接入測試是對當前傳輸業務中數據文件傳輸、BUFR標準格式數據傳輸、雷達數據流傳輸3種業務傳輸分別測試,即文件傳輸、消息傳輸和流傳輸測試[2]。
在進行測試前首先檢查FTP服務與用戶、分發主機、分發用戶、收發策略和收發進程等配置是否正確,然后從業務集群上手工拷貝一些數據到單機版上進行測試,觀察單機版的收集、處理、分發是否正常。
以區域站打包文件為例,將固定時次的數據文件手動拷入A機的接入目錄,查詢收集日志、處理日志和發送日志均有該類資料的處理信息且在本地收集歸檔目錄下有歸檔數據文件,查看RMQ調度隊列無積壓,且向下游發送DPC和TLQ消息,向MCP和天鏡發送DI,單機版監控頁面中該類資料正常接收,這樣就實現了文件傳輸數據接入測試。
首先確認消息傳輸服務正常工作,然后通過MsgTransferClient軟件(Windows版)生成消息發送到單機版測試消息傳輸功能。以國家站小時BUFR標準格式數據文件為例,手動拷貝單個時次BUFR文件放至程序入口目錄,檢查軟件成功生成消息并推送給單機版消息服務器,查看單機版歸檔目錄生成原始BUFR文件和質控后BUFR文件,消息處理日志和消息質控處理日志均有該類資料的處理信息,RMQ傳輸隊列和RMQ服務隊列均有消息[3],查看單機版監控頁面該類資料正常接收,如此就實現了消息傳輸數據接入測試。
首先確認流傳輸服務正常,在業務集群雷達數據流收發配置管理界面的“轉發節點表設置”選項中增加單機版流傳輸服務器地址[4],在“雷達站點表設置”選項中選擇某一個雷達站增加單機版雷達站流傳輸轉發節點配置,完成流傳輸從CTS2.0向單機版轉發的步驟。修改單機版雷達流收發配置管理的相關配置信息,接收CTS2.0傳輸的雷達數據。通過查看單機版雷達流緩存路徑、數據歸檔目錄和雷達流日志檢驗流傳輸數據接入測試正常。
業務集群與單機版之間進行切換的流程較為復雜,因此采用人工切換的方式,通過固化操作步驟形成切換方案。
3.1.1 業務集群切換單機版
切換前確認單機版A機上FTP服務和文件傳輸應用都正常,然后停止CTS2.0業務集群向MCP推送DI并啟動單機版向MCP推送DI進程,停業業務集群的FTP服務,登錄負載均衡管理頁面,在相應節點池中禁用業務集群地址,啟用單機版節點地址,即完成虛擬服務地址指向單機版的操作,注意刪除相應的節點池監視器,最后檢查確認切到單機版后的運行狀態情況即確認虛擬地址FTP服務、數據收發情況、資料傳輸監視情況、共享入庫情況均正常則完成業務切換。
3.1.2 業務回退
啟動業務集群FTP服務,root用戶停業單機版A機的FTP服務,登陸負載均衡管理頁面禁用單機版地址,啟用業務集群地址,添加相應的節點池監視器即完成虛擬服務地址切換到業務集群的操作。最后檢查確認虛擬地址FTP服務、數據收發情況、資料傳輸監視情況、共享入庫情況均正常則完成業務回退。
3.2.1 業務集群切換單機版
切換前確認單機版A機上消息傳輸應用正常;停止業務集群的消息傳輸應用,登錄負載均衡管理頁面,在IP組中修改消息傳輸 IP 組的地址即完成虛擬服務地址指向單機版節點的操作;重啟DPC、MDOS消息解碼入庫程序,檢查負載均衡節點池狀態和單機版節點并發連接數、歸檔目錄、RMQ 傳輸隊列和RMQ服務隊列、資料傳輸監視情況、共享入庫情況均正常則完成業務切換。
3.2.2 業務回退
使用CTS用戶停止單機版A機的消息傳輸應用;登陸負載均衡管理頁面修改消息傳輸IP組地址,啟動業務集群的消息傳輸應用,重啟DPC、MDOS消息解碼入庫程序,檢查業務集群的運行狀態、歸檔目錄、RMQ傳輸隊列、RMQ服務隊列、資料傳輸監視情況、共享入庫情況均正常則完成業務回退。
3.3.1 業務集群切換單機版
切換前確認單機版A機上流傳輸應用正常,停止業務集群的流傳傳輸應用,登錄負載均衡管理頁面,在IP組修改數據流傳輸IP組地址,同步業務集群緩存數據至對應的單機版緩存目錄下;檢查單機版主頁雷達流連接情況、緩存路徑下數據接收情況、歸檔目錄和資料入庫情況正常則完成業務切換。
3.3.2 業務回退
使用CTS用戶停止單機版A機的雷達流傳輸應用,登錄負載均衡管理頁面修改數據流傳輸IP組的地址,啟動業務集群的流傳輸應用,檢查切換到業務集群后的運行狀態正常則完成業務回退。
國內氣象通信系統寧夏省級系統是該區氣象數據傳輸的核心業務系統,承擔全區各類信息數據上傳中國氣象局,以及分發至CIMISS寧夏省級系統的職能,經過系統單機版軟硬件安裝部署、網絡安全策略調整、核心業務關聯等方面建設,為應急情況下氣象信息數據的傳輸提供了有效的備份手段,提高了氣象數據傳輸業務水平。