王山海,馬鑫鑫,劉 謙
(河南省人工影響天氣中心,河南 鄭州 450000)
云計算(cloud computing)是分布式計算、并行計算和網格計算的發展,是一種新型的計算模式。目前云計算技術得到了迅猛的發展,在商業界也到了廣泛的應用。亞馬遜、微軟、Google、阿里、華為等各大公司都提出了各自云計劃,準備在這一新興的領域占領制高點,打造新的盈利模式。另外學術界對該研究也從來沒有停止過,各種新理論新方法層出不窮。云計算的普及勢必將為各行各業帶來重大變革,氣象行業同樣將受到重大而深遠的影響[1]。云計算最大的特點是分布式(distributed)和虛擬化(virtualization),它可以將分布的數據以及分散的計算資源集中起來,允許用戶按需申請服務[2]。與物理設備相比,云計算模式既可以滿足計算需求,也能大大降低成本。
人工影響天氣(簡稱“人影”),指在適當條件下,人們通過科技手段對局部大氣的過程進行影響,使某些局地天氣朝著有利于人類的方向轉化,從而避免或者減輕氣象災害,合理利用氣候資源,實現增雨(雪)、防雹、消雨等目的[3]。目前實施人影作業主要有地面高炮(火箭架)和飛機兩種方式。地面作業通常利用高炮或者火箭架向目標云發射炮彈、火箭彈,將催化劑播撒在云中,從而影響云微物理過程。飛機人工影響天氣作業則是在空中飛行,將催化劑直接播撒,影響云物理過程。
在進行人影作業時,對作業潛力區的分析是必不可少的步驟。只有將催化劑播撒到潛力區內,才能取得良好的作業效果,實現人影作業目的。目前對作業潛力區的分析主要是使用PC機,對大量的數據進行研究,得出合理的結果。隨著對人影作業科學性、時效性要求的提高,傳統PC機的計算瓶頸逐漸顯現,它無法滿足科學作業,發展智慧人影的需求。基于這種現狀,如果能將云計算模式引入到人影領域,必將充分發揮云計算作用,大大促進人影作業效果的提升。
近年來,隨著數據的爆炸式增長,快速處理海量的大數據成為必然,這對計算能力的需求提出新的挑戰。客觀上要求一種不同于傳統方式的計算框架。在這種情況下,“云計算”的概念被提了出來。云計算綜合了分布式計算、并行處理和網格計算,能夠向各種應用提供基于硬件、基礎架構、平臺、軟件以及存儲服務[4]。云計算的核心目的是實現對計算資源、網絡資源、存儲資源的管理。
云計算目前已經在學術界和產業界受到了廣泛的關注和應用,但還沒有關于云計算的統一定義。關于云計算的定義主要有如下幾種。
(1)云計算是一種能夠以靈活的方式提供計算資源的服務,滿足用戶按需所求,避免資源浪費[5]。
(2)云計算是一種并行的、分布式系統,可以按照約定的服務等級提供服務[6]。
(3)云計算屬于一種虛擬化的計算資源,調用者使用時按需付費[7]。
從上述定義中可以發現,幾種定義都將云計算看作服務。但是,這些定義都不完善。通過上述分析可以看出云計算架構具有較好的性能。它將資本投入變成可變投入,減少了投資構建數據中心和服務器的盲目性,按需付費,降低了成本。還可以從大型規模經濟中獲益,使用云計算,遠比自己投資硬件性價比高。同時無需考慮所需硬件設備容量,避免過高的資源配置造成浪費,也避免了過低的資源配置無法滿足應用需求。在云計算環境中,網絡配置靈活性大大增加,IT資源配置快速。
根據云計算架構及服務目的,主要可以分為以下幾類:
(1)SaaS(軟件即服務,software as a service)。
這種類型的云計算模式在互聯網上一般通過瀏覽器對應用程序進行交付。通常,SaaS應用可提供廣泛的配置選項和開發環境,客戶能夠方便地對自己的代碼進行修改和添加。
(2)IaaS(基礎設施即服務,infrastructure as a service)。
IaaS公有云供應商主要提供計算和存儲服務。這種服務具有高可伸縮數據庫、虛擬專用網絡、大數據分析、機器學習等等。
(3)PaaS(平臺即服務,platform as a service)。
PaaS所提供的服務和工作流主要專門針對開發人員,這種服務可以方便開發人員快速開發、測試、部署應用程序。
云計算是一種新型的計算架構,它以數據為中心,在數據存儲、數據計算、云通信等多方面具有自身獨特的技術[8]。
(1)為保證可用性、可靠性以及經濟性,云計算存儲采用分布式存儲的方式。同時,云計算需要提供并行服務,從而保證大量用戶的并發訪問服務。需要具有高吞吐率和高傳輸率的特點。云計算常用的存儲技術主要有谷歌的GFS(Google file system)和Hadoop開發的GFS的開源實現HDFS(Hadoop distributed file system)。大多公司應用的都是HDFS的數據存儲技術。
(2)云計算系統對大數據集進行處理分析后向用戶提供高效的服務。因此,數據管理技術必須滿足能夠高效地管理大數據集的要求。其次,如何在規模巨大的數據中找到特定的數據,也是云計算數據管理技術所必須解決的問題。云計算的特點是對海量的數據存儲、讀取后進行大量的分析,數據的讀操作頻率遠大于數據的更新頻率,云中的數據管理是一種讀優化的數據管理。因此,云系統的數據管理往往采用數據庫領域中列存儲的數據管理模式。將表按列劃分后存儲。云計算的數據管理技術中最著名的是谷歌提出的BigTable數據管理技術[9]。
(3)為了使用戶能便利地享受云計算帶來的服務,讓用戶能利用該編程模型編寫簡單的程序來實現特定的目的,云計算上的編程模型必須十分簡單,必須保證后臺復雜的并行執行和任務調度向用戶透明。云計算大部分采用Map-Reduce的編程模式。目前主流IT廠商提出的“云”計劃中采用的編程模型,都是基于Map-Reduce的思想開發的編程工具。Map-Reduce不僅僅是一種編程模型,同時還是一種高效的任務調度模型。Map-Reduce這種編程模型并不僅僅適用于云計算,在多核和多處理器、Cpu processor以及異構機群上同樣有良好的性能[10]。
云計算層次關系如圖1所示。

圖1 云計算層次關系
由大氣中的水汽凝結(凝華)形成水滴、冰雪晶或它們的混合物組成的可見懸浮體形成云霧[11],構成降水的必要條件。云粒子在空中繼續吸附水汽,體積與重量逐漸增長,獲得較大的下落速度,并且在下落過程中沒有被蒸發掉,才能形成降水(見圖2)。

圖2 云霧降水微物理機制
自然界中的云具有不同的外形和空間尺度,可以存在于不同的高度,其組成也有固態或液態之分。通過分析云的分布情況和演變過程,可以研究當時的天氣形勢和水汽狀況,還可以預測未來天氣的變化。人工影響天氣作業的開展,正是基于對云進行充分的宏、微觀研究,掌握云霧降水機制,開發空中水資源,增加降水。但長期以來,由于云霧、降水和可降水量有很大的不確定性,尤其是對云的了解還很不透徹,人工影響天氣作業中存有很大的盲目性[12]。這樣導致了作業資源浪費,貽誤作業時機,不能充分發揮人影作業效益。
中國的人工影響天氣始于20世紀50年代,通過50多年的發展,目前人工影響天氣無論從作業規模還是作業經費投入都處于世界前列。同時,國家大力支持建設東北、西北、中部區域人工影響工程。21世紀初,出于抗旱防災、減災和改善生態環境的需要,中國人工影響天氣呈現快速發展勢頭,國家也增大了對人工影響天氣研究的支持力度,同時學術界對人工影響天氣的理論和探測研究也得到了快速發展。為了更好地開展人工影響天氣業務,切實提高人影作業效益,全國氣象部門以及相關高校科研院所對人影業務的關鍵技術的研究不斷深入和加強。
針對每一次天氣過程,為了實現不同的需求,取得作業實效,應當在適當的時機,對適當的云體,播撒適當劑量的催化劑,即做到三適當[13]。而對作業潛力區的準確分析是做到三適當的前提。對人影作業潛力區的研究主要從天氣形勢、高空探測、數值模式等云降水微觀特征方面展開,選取適宜人工增雨作業的云系。目前已有大量的科技文獻從播云溫度窗、過冷水含量與冰晶濃度、云的宏觀特征以及多普勒雷達等方面論述了作業潛力區的選取。
無論采用哪種關鍵技術,原始觀測資料是必不可少的內容。結合河南人影中心的實際業務,常用的觀測資料包含以下內容,如表1所示。從表中可以看出,人影特種觀測資料數據量較大,種類較多,如果使用傳統的PC機或者服務器來進行數據處理,將無法滿足人影業務的需求。因此,在人影領域引入云計算模式是一個不錯的選擇。
衛星云圖是通過氣象衛星觀測到的地球上的云層覆蓋地表特征的圖像。目前接收的云圖主要有紅外云圖、可見光云圖及水汽圖等。在天氣分析中可以利用衛星云圖識別天氣系統,估計其強度和發展趨勢,為研究天氣提供依據。目前在學術界已有大量基于衛星云圖應用展開的研究。文獻[14]以FY2號氣象衛星云圖為研究對象,利用圖像分割技術,去掉非臺風云系,定位臺風中心;文獻[15]選取了1995-1998年的冰雹衛星云圖,分析了產生冰雹衛星云圖的特征,為冰雹預報提供了技術方法;文獻[16]針對中尺度強對流云團的衛星云圖識別,設計了短時臨近預報系統;文獻[17]利用衛星云圖及其他資料分析了2002年7月17日在華北地區上空出現的中尺度渦旋成因,對于提升對流性天氣預報質量有很好的幫助作用。這些文獻的研究內容都是基于衛星云圖展開的,雖然衛星云圖在人影研究中具有重要作用,但是衛星云圖數據量較大,特別是衛星反演數據的獲得,對計算機硬件要求較高。

表1 人影特種觀測資料
雷達在人工影響天氣領域的應用也已開展了大量的試驗研究工作。青海省氣象局、中國科學院大氣物理研究所利用711雷達回波、地面和高空加密觀測等資料在黃河上游的瑪曲地區開展人工增雨試驗,研究表明天氣雷達在這一工作中發揮了重要作用[18]。2002秋季和2003年春季,分別在青海省、河南省開展的云和降水的雷達觀測,為人工影響天氣研究工作提供了參考數據[19]。文獻[20]研究表明,多普勒天氣雷達風場資料可為天氣系統的中尺度結構分析和人影作業潛力區的劃定提供更多判定依據,它在開展人影作業指揮、作業效果評估、云和降水動力機制研究等領域具有較大的應用潛力。
云降水數值模式是人工影響天氣研究中的一個關鍵組成部分。云降水模式是將云的三維動力學方程和云微物理方程聯立,結合觀測和實驗結果求解。通過方程的求解,可以模擬云降水的發展演變過程。數值模式的作用體現在它能夠在相同的云況下比較人影作業前后云的異同,從而可以明確人影作業的效果。同時,它也可用這些過程來重建過去的試驗條件,計算其應有的播云效果。這些程序也可用來模擬播云物質的擴散效果,提供外場試驗和作業所需的實時預報,在作業區外檢驗播云后的潛在效應,從而有助于人影試驗的統計分析。隨著云降水微物理過程認識的不斷深入以及計算能力的提高,可以降低人工影響天氣工作的很多不確定性,提升業務能力和科技水平[21-22]。目前河南省人影中心使用的模式是GRAPES-CAMS模式和WRF模式,由于模式運算對計算機性能要求較高,地方人影機構無法滿足硬件要求,因此這兩種模式都是國家局人影中心計算出來后面向全國下發。如果能夠使用云計算方式,結合河南本地特征元素,在河南本地進行模式優化計算,對指導開展人影業務將會有更強的針對性。
利用上文提到的衛星、雷達、模式等資料和數據對2004-2013年10年間中部區域春、秋季降水過程進行統計分析,歸納出典型降水類型的天氣系統和降水特點,總結出人影增雨潛力區相關指標,如表2所示。如果云系滿足這些指標,則認為具備增雨潛力,可以進行人工增雨作業[23]。
河南省氣象局信息中心為了給各業務單位提供高效的計算、存儲、通信服務,減輕各業務單位的運維壓力和投資成本,利用氣象局內網,統一部署了云計算平臺。省人影中心根據日常業務需要,向信息中心申請了云存儲服務,將傳統的海量觀測資料統一上云。
在人影日常工作中,為了做好人影業務分析工作,提高人影作業的準確性和針對性,所用到的氣象數據成倍增長,每天的自動站、雷達、雨量、衛星等數據高達17 G左右,需不斷投資購買昂貴的硬件設備,維護成本也居高不下。而云計算存儲可以將數據儲存在云端,集中維護,通過網絡方便地為用戶提供實用的存儲服務。云存儲對用戶端的設備要求較低。具體到氣象行業,科研人員只要用終端設備連接到云,就可以下載到需要的數據。

表2 中部人影增雨潛力區指標
目前河南省人影中心針對云計算這種先進的IT架構,僅僅利用了云存儲模式。基于云計算平臺,利用Hadoop工具,充分發揮云計算性能,將其應用到人影業務中,具有更大價值。人影業務每天使用的天氣預報產品以及各種觀測數據,需要大量的科學計算才能給出,特別是對于模式數據,需要小型機來處理,這對于一般的省級和地市級人影部門是不現實的。而云計算能夠給人影工作帶來性能強大、配置靈活和成本低廉的協作與創新平臺,提高效率。
另外,氣象是一個數據資源豐富的行業,國家對氣象部門建設的投入力度不斷加大。雖然各單位都積累了大量的信息資源,但存在信息孤島的現象,缺乏一個行業、部門之間的氣象信息共享平臺,無法充分發揮信息資源的作用。同時,重復建設問題也十分突出,造成資源浪費。基于云計算的模式將很好地解決這個問題。對于人影行業和航空、農業、林業、水利部門之間可以創建部門云,各部門把資料放在同一云中,資料共享,共同合作,協同工作,各取所需。對于不同級別的省市縣人影部門同樣可以在一個云中共享資料和數據,降低建設成本。
云計算作為一種新型的計算模式,具有計算性能強大、部署快速簡單、投資成本低廉的優勢,在學術界和產業界得到了快速的推廣和發展。人工影響天氣業務在防災減災、改善生態環境中發揮著越來越重要的作用,在實施人工影響天氣作業過程中,首先需要對大量的雷達、衛星等觀測數據進行詳細的分析與復雜的模式計算,才能得到精確的分析結果。而傳統的計算方式都是采用PC機、服務器模式,隨著對人影作業時效性和準確性要求的提高,需要分析的觀測數據量越來越大,模式計算復雜程度越來越高,傳統的計算方法已經無法滿足計算需求。如果能將高效先進的云計算模式引入到人影業務中,將大大提高計算的時效性和準確性,對作業潛力區的分析更加精準,從而使得人影作業更加有效,可以提高人影作業效益,使人影業務發揮更大的作用。