施佳馳 劉丹楓 陳青鋒 方昆
【摘 ?要】隨著信息化不斷發展,信息化業務及數據呈現暴增趨勢。在氣象行業信息化前沿,支撐業務運行的基礎設施資源規模和數量也越來越龐大,出現故障的概率也越來越高,給監控和運維管理帶來嚴峻挑戰。為解決上述問題,天鏡系統應運而生,通過實時掌握業務系統運行狀況,對硬件、軟件及相關應用進程狀態進行監視,同時根據閾值實現實時告警,從而方便運維人員進行集中監控。MICAPS4是氣象部門氣象衛星、天氣雷達和數值預報、站點實況等產品綜合應用最強有力的業務技術支撐平臺,是氣象預報最主要的預報業務系統。基于天境系統進行MICAPS4.0分布式數據環境(以下簡稱數據環境)對接開發,實現對數據環境全方位的主機監控,包括對數據環境軟硬件的實時監視、狀態查詢、前臺展示、異常告警。此外,對數據環境的資料到達情況進行統計,對湖南全省各直屬單位、市州縣MICAPS4客戶端對數據環境的訪問情況、Cassandra集群訪問負載分布情況進行監測與分析。
【關鍵詞】MICAPS4;數據環境;主機監控;天境系統
1 ?平臺簡介
1.1 ?天鏡系統簡介
天鏡,即氣象綜合業務實時監控系統。它如同一面鏡子,映照出氣象業務全流程中信息的“流動”、系統的運行、網絡安全動態……在這面鏡子的幫助下,氣象業務系統的運行維護實現了一體化運行,管理現代化和信息化水平得以大幅提升。湖南省“天鏡”系統,通過應用云計算、大數據、分布式數據庫以及人工智能等多種新的IT技術,以數字化的形式實時反映了業務系統的運行現狀、快速診斷出數據流程中的問題,極大的提高全省實時業務的保障能力。
1.2 ?MICAPS4分布式數據環境簡介
MICAPS4分布式數據環境能提升高分辨資料的應用效率,實現對確定性模式資料與集合預報進行深度應用,從而為精細化預報業務提供了平臺支撐。其采用先進IT、預報技術與氣象業務發展結合,實現了預報數據環境與省級數據中心的全面融合,為預報員提供了功能完整的客戶端預報平臺。
MICAPS4分布式數據環境的優勢是能與湖南省級數據中心無縫銜接,海量氣象數據到達數據環境DPC服務器即可實現解碼處理,數據環境Cassandra服務器能提供高速緩存服務,實現高并發、高速訪問能力,實時數據到達即可見。
2 ?系統對接開發
2.1 ?系統組成
對接開發系統由監控數據采集程序、MySQL數據庫、桌面應用程序、釘釘機器人告警模塊、天鏡系統對接模塊等部分組成。首先在服務器上部署監控數據采集程序,將采集到的監控數據寫入到MySQL數據庫,客戶端再從數據庫中讀取數據進行數據統計與展示,當監控信息超過設定的閾值時由釘釘機器人告警模塊將告警信息及時通知數據環境的核心運維人員,并將MySQL中的監控數據與天鏡系統本地化應用服務進行數據對接。
2.2 ?監控數據采集
監控數據采集程序主要通過SSH方式獲取主機(服務器)CPU、磁盤、內存、文件系統、進程、網絡等的運行狀態。監控數據采集程序采用Python編程語言進行程序設計,采用輕量級定時任務調度庫schedule進行任務調度,采用paramiko、ftplib模塊使用ssh、ftp等方式獲取業務監控實時數據。
2.3 ?MySQL數據庫
監控數據采集程序將采集到的監控數據通過pymysql模塊寫入到先行建立的關系型數據庫MySQL中,為桌面應用程序與天鏡系統本地化應用程序提供數據服務。
2.4 ?桌面應用程序
桌面應用程序采用Qt、C++進行程序開發,使用QSS、QML對桌面應用進行界面美化,使用QtCharts圖表庫將采集到的業務監控數據、全省MICAPS4.0的終端用戶訪問情況進行數據統計、分析與展示。
2.5 ?告警提示模塊
告警提示模塊采用webhook技術的釘釘機器人將監控系統的運行狀況及時通知業務系統核心運維人員。當監控數據超過事先所設閾值時,產生告警信息及時通知數據環境核心運維人員。告警模塊首先通過獲取群組中釘釘機器人的Webhook地址,然后向這個地址發起HTTP、POST 請求,實現向給該群組發送即時告警信息。
2.6 ?天鏡系統對接模塊
MySQL數據庫中的監控數據與天鏡系統本地化應用服務進行全面對接,前端采取Vue,后端采用SpringBoot、Spring MVC、Spring、Mybatis等技術棧,開發完成后在天鏡系統OMP運維管理控制臺的模塊倉庫模塊中上傳相應模塊,從而實現與天鏡系統的數據對接。
3 ?小結
本文通過對基于天境系統的MICAPS4.0分布式數據環境進行對接開發,實現了在天境系統中對數據環境核心業務基層監控功能與對省市縣三級用戶MICAPS4客戶端使用情況的實時分析,提升了數據環境的運維保障能力,從而更好地保障氣象預報工作的開展,為基層遞進式氣象服務和氣象數據的高效流轉處理保駕護航。
作者簡介:
施佳馳(1990-),男,江蘇省丹陽市,碩士研究生,工程師,研究方向:網絡與系統管理。
基金項目:
湖南省氣象局 2020 年短平快項目(課題編號:XQKJ20B039)(基于天境系統的MICAPS4.0分布式數據環境監控與全省終端用戶分析)。