中圖分類號:TN957 文獻標志碼:B 文章編號:2095-3305(2025)05-0184-03
隨著新一代天氣雷達硬件和軟件的逐漸升級,特別是在經過雙偏振改造后,雷達的分辨率大幅度提高,同時雙偏振雷達在單偏振雷達的基礎上多出5個探測量(差分反射率 ZDR 、協相關系數 ρhν/CC 、差分相移
、差分相移率 KDP 和退偏振比LDR),使得數據量大大增加。以汕頭天氣雷達站為例,臺站每天需要存儲的雷達基數據、產品、PNG圖和狀態信息,經壓縮后仍有3GB多,使用傳統的“計算機存儲+DVD光盤備份”的方式已難以適應臺站的工作需求,也增加了非臺站的氣象科研人員從臺站獲取雷達數據的難度。
針對氣象大數據的存儲問題,前期已有一些計算機和氣象工作者展開了相關研究。祖東輝[1]針對雷達數據中特定回波數據需要快速查詢的特點,設計了一種大容量雷達數據存儲與管理系統;雷鳴[2基于大數據技術,以關系型數據存儲、分布式NoSQL數據庫存儲、網格存儲系統和分布式NAS存儲相結合的混合云存儲架構為基礎,建立了統一數據集,服務于省局氣象數據中心。這些研究相對復雜,或主要針對更高一級的氣象數據中心,在實際應用時部署成本較高,無法適應基層臺站的工作需求。因此,設計了一種適合雷達站的在線存儲數據方法,既能滿足臺站大容量存儲需求,又能實現臺站可控的在線訪問,以便后期對雷達產品進行應用開發。
1方案選擇
新一代天氣雷達主要由數據采集單元RDA、雷達產品生成系統RPG和主用戶處理系統PUP三部分組成[3]。雷達基數據和狀態信息在RDA系統上生成,雷達產品和PNG圖在PUP系統上生成,這部分數據未經壓縮且文件過多,大量占用計算機空間,不便于日常管理和日后查詢使用。因此,臺站在選擇存儲方案時應滿足以下三點:一是存儲空間夠大且安全,臺站人員不必因存儲容量不足而焦慮;二是能及時分類和整理大量不同類型的雷達數據,以便臺站人員快速查詢;三是能夠實現自動存儲,并在臺站可控的情況下,充許業務內網用戶在線訪問。
如果僅從存儲容量的角度出發,初期想法是直接給RDA和PUP計算機配備大容量硬盤。但RDA和PUP均為業務專用機,預置linux系統,用于實時生成雷達數據。在業務專用機器上增加或改變軟硬件配置,如果出現不兼容問題,會引發嚴重后果。即使無兼容性問題,由于大量零碎分散文件長期累積,最終也難以整理和歸檔,并且無法實現在線訪問。故臺站提出了一種方案:購買一臺專用數據計算機,配置超大存儲硬盤,將雷達生成的實時數據直接上傳至專用計算機,再進行分類整理。該方案雖然可以解決存儲容量、資料分類以及內網在線訪問的問題,但是普通計算機的使用壽命無法得到保證,一旦存儲硬盤出現故障,數據將直接丟失,嚴重影響臺站工作。因此,以上方案被逐一否定。
從數據安全的角度考慮,必須使用磁盤陣列(RAID)技術。RAID是將多塊獨立的磁盤組合成一個容量巨大的磁盤組,利用個別磁盤在提供數據時所產生的加成效果,提升整個磁盤系統的效能。使用這項技術可將數據切割成許多區段,分別存放于各個硬盤。RAID技術還能利用同位檢查(ParityCheck),數組中任意一個硬盤故障時仍可讀出數據;在數據重構時,將數據經計算后重新置入新硬盤,提升數據安全性。
馮志偉等[論證了RAID技術在氣象資料數據存儲中的應用,并詳細分析了較為常用的DAS、NAS和SAN3種存儲體系的結構及特點。結合汕頭天氣雷達站的實際工作條件,在綜合考慮數據的安全性、長久性,以及部署成本、效率等因素后,最終設計出利用“專用數據處理機+NAS+FTP”傳輸方案,實現雷達數據的自動存儲和在線訪問。
其中,NAS(NetworkAttachedStorage)可譯為網絡附加存儲,是一種專用網絡數據存儲備份器。其以數據為中心,將存儲設備與服務器徹底分離,集中管理數據,從而釋放帶寬以提高性能,降低總成本。其成本遠遠低于使用服務器存儲,而效率遠遠高于后者,具有較高的性價比[5]。NAS本身是一臺獨立的、外設的、功能強大的RAID,有數據保護,且使用和操作界面簡潔,專業性不強的人員也能管理。
2具體方案部署
雷達數據采集單元RDA和主用戶處理系統PUP實時生成的雷達數據由于文件過多且未經壓縮,無法直接放入NAS服務器作為臺站資料保存。因此,必須引入一臺數據處理機以實現雷達數據的緩存、整理和使用,再由數據處理機將整理好的數據同步傳送至NAS服務器永久保存。數據傳輸示意圖如下(圖1)。

2.1 數據處理機
數據處理機的工作流程主要是先接收來自RDA和PUP的雷達實時數據,再將其整理并壓縮,使之成為便于存儲、管理和查詢的雷達資料,最后同步傳送至NAS服務器。因此,數據處理機需要部署以下三個方面的內容:一是建立多用戶FTP服務器,將其與RDA和PUP連接;二是對RDA和PUP傳輸的數據進行分類壓縮,該過程可通過編程實現;三是設置NAS服務器的同步傳輸功能。
為便于操作,汕頭天氣雷達站的數據處理機使用Windowsserver2012系統,通過系統自帶的IIS8.0建立4個用戶FTP服務器,不同賬號對應不同目錄,分別接收來自RDA和PUP的雷達基數據、狀態信息、雷達產品和PNG圖,使得4種不同的資料被分別歸檔于數據處理機的4個不同目錄。再通過雷達站工作人員編寫的自動分類整理壓縮軟件,對這4種資料分別進行按天整理和壓縮,最終將雷達每天實時生成的幾萬個文件打包成4個壓縮文件,以時間 + 資料名”的格式命名(如20230501汕頭雷達基數據.zip、20230501汕頭雷達產品.zip、20230501汕頭雷達PNG圖.zip、20230501汕頭雷達狀態信息.zip),最后分別歸檔到另外4個目錄,并按年月逐級目錄遞歸。壓縮完成后,軟件會自動刪除被壓縮的源文件,節約儲存空間。
為實現數據處理機與NAS服務器之間的同步增量上傳,數據處理機需安裝NAS服務器的配套軟件,汕頭天氣雷達站使用的NAS服務器是群暉DS1618+,與之配套的同步軟件PC端是“Cloud Station Backup\"軟件安裝完成后,在軟件中設置NAS服務器的IP地址、賬號密碼以及需要同步上傳的4種壓縮文件的目錄。數據處理機在正常工作時,在4種壓縮文件的目錄下一旦發現增量包會自動將增量包上傳至NAS服務器。
2.2 NAS服務器
群暉DS1618+采用6硬盤位設計,汕頭天氣雷達站采用了6個4TB的企業級硬盤組成的磁盤陣列,總共 24TB 容量,除去4TB的數據冗余,還剩20TB的可用存儲空間,以臺站每天3GB的數據量算,可以連續存儲18年多,從而解決存儲空間不足的問題??紤]到數據安全和存儲空間最大化,在創建存儲空間時,雷達站工作人員選擇群暉的SHR作為磁盤陣列模式。
SHR(SynologyHybridRAID)是群暉的自動RAID管理系統,可使用戶創建能優化容量和性能的靈活存儲方案[6-7]。當NAS服務器只有1個硬盤時,RAID為BASIC模式,無數據保護;當再添加1個硬盤時,RAID的模式自動轉換成類似RAID1模式,空間大小不變,但有數據保護;當使用 N(Ngt;3) 個硬盤時,RAID會自動轉換成類似RAID5模式,有數據保護,使用不同容量硬盤時又能比RAID5模式獲得更大的存儲容量,且易于使用。
此外,傳統RAID的存儲基于存儲池中最小的硬盤。如果傳統RAID存儲池中的最小硬盤為500GB,則存儲池中所有其他硬盤各自只能提供 500GB 的儲存空間。因此,存儲池最終僅有2TB的可用存儲和4.5TB 的浪費存儲。與傳統RAID不同,SHR將每個硬盤的存儲空間分成小塊,并創建額外的冗余存儲,即將4.5TB的不可用存儲分成較小的可用塊,并盡可能地增加每個硬盤的存儲容量。SHR在存儲擴充方面也優于傳統RAID。傳統RAID不允許在存儲池的所有硬盤均更換為較大硬盤前進行擴充,但SHR允許在2個硬盤升級后立即擴充存儲池,并形成冗余存儲陣列。
按照群暉DS1618+設備的說明手冊安裝好硬盤,并使用網線將其連接至汕頭天氣雷達站業務內網的交換機上。為方便客戶安裝使用,群暉DS618+內置了WebAssistant工具,在打開DS618+設備電源后,使用雷達站業務內網中任意一臺計算機打開網絡瀏覽器,并訪問“http://find.synology.com”或“http://diskstation:5000\"(Mac計算機使用“http://synologynas.local:5000”),WebAssistant會在網絡瀏覽器中啟動,在本地網絡中搜索并找到Synology設備。初次登錄時,新設備狀態為未安裝,用戶還需進一步安裝群暉的DiskStation
Manager(DSM)系統,再根據提示進一步操作,無特殊需求的內容可全部使用默認設置。系統安裝完成后會重啟,并提示用戶創建管理員賬戶和密碼。
使用群暉默認的管理員賬戶登錄DSM系統,從主菜單進入“存儲空間管理員”,按照“存儲空間創建向導”提示,將RAID模式設為SHR模式,快速創建存儲空間;進入“套件中心”安裝服務器端的“CloudStationServer”套件,以實現數據處理機與NAS服務器之間的同步傳輸。NAS本身支持NFS、CIFS、FTP、HTTP等協議,因此雷達數據的在線訪問可通過NAS自帶的FTP協議完成。具體而言,使用默認的管理員賬戶登錄群暉DSM系統,從“控制面板”進入“用戶賬號”配置選項,通過新增用戶賬號,配置1個安全的FTP訪問賬戶及密碼,并將該賬號設置為“只讀”權限;進人“共享文件夾”配置選項,通過新增共享文件夾,將與數據處理機同步傳輸的4個雷達資料文件夾設置為共享模式,并設置充許FTP賬戶“只讀”的訪問權限。
系統部署完成后,在被許可的單位或個人請求從雷達站下載雷達資料時,臺站人員反需登錄群暉DSM系統,在\"文件服務”的\"FTP”一項中勾選“啟用FTP服務”(圖2),對方即可通過臺站人員提供的FTP賬號和密碼從NAS服務器上查詢和下載雷達資料。在啟用FTP服務時,可開啟“保存FTP日志”功能,通過日志了解對方登錄和退出FTP服務器的時間和下載內容,預防數據泄露。在沒有訪問需求時,臺站人員可以關閉FTP服務,實現在線訪問功能可控,增強數據安全性。

通過以上數據處理機和NAS服務器的部署設置,汕頭雙偏振天氣雷達的所有資料全部實現了自動分類、整理和歸檔,無需人工干預,且所有歸檔資料按年月逐級目錄遞歸,文件名按日期命名排列,查找和使用一目了然。同時,利用NAS服務器上的FTP功能,實現了雷達資料的內部共享,為后期開展雷達產品的研發工作提供了支持。
2.3 日常檢查和管理
雖然本方案的實施促使雷達站日常的數據存儲工作實現全自動化,但在日常工作中,臺站人員仍應定期檢查、維護和管理設備,以保障設備正常工作,確保數據存儲安全。具體措施如下:一是定期檢查NAS的運行日志。NAS日志詳細記錄了NAS系統的運行狀況,特別是RAID的運行情況,并將每個事件標記了序列號、嚴重等級等。如遇硬盤故障等嚴重事件,臺站人員可及時發現和處理,避免數據丟失。二是定期檢查數據處理機運行情況。數據處理機處理完成的是最終備份的雷達資料,為保證資料齊全、分類明確,臺站人員需要定期檢查雷達數據自動整理軟件的運行情況和資料同步傳輸情況。三是定期更換FTP賬戶的登錄密碼,以增強FTP訪問的安全性。
3結束語
自全國新一代多普勒天氣雷達網建設以來,中國氣象局要求不但要有一流的硬件設備,還要有一流的應用開發。NAS服務器不僅能實現雷達資料在線存儲,其拓展功能也非常強大,為以后雷達大數據的應用和共享提供了有力支持。以上方案自試運行以來流程穩定,臺站人員從以往定期刻錄光盤的工作中徹底解放。相較于以前的計算機存儲加光盤備份方式,該方案顯著提高了雷達數據的安全性。利用FTP的在線共享功能,提升了后期雷達資料二次開發和使用的便捷性。
參考文獻
[1]祖東輝.大容量雷達數據存儲與管理技術研究[D].成都:電子科技大學,2016.
[2]雷鳴.氣象大數據分布式存儲設計與實現[J].計算機技術與發展,2021,31(5):193-197.
[3]劉家冠,湯強,吳榮深,等.雷達站遠程控制和無人值守方案的初步研究[J].氣象水文海洋儀器,2011,28(3):19-21.
[4]馮志偉,盛梅,陳世春.磁盤陣列技術在氣象資料數據存儲中的應用[J].中國科技信息,2007(19):108-109.
[5]陳鉆.NAS存儲系統在局域網中的應用分析及方案[J].華章,2014(27):341-342.
[6]陳華英.磁盤陣列RAID可靠性分析[J].電子科技大學學報,2006,35(3):403-405.
[7]吳宏波.基于Serv-U的個人在線存儲系統的設計與實現[J].現代計算機,2011(9):102-105,109.