■ 賈朋群 張萌
剛剛過去的2021年,全球氣象界的一個熱點,是以“機器學習”(machine learning,ML)和“神經網絡”(neural network,NN)等為代表的AI技術,從幾年前有“炒作”嫌疑和爆炸式的登場,到開始入駐氣象研究和業(yè)務各領域并產生效果和積極影響的過渡年。伴隨這樣的過渡,“trustworthy”一詞被很多學者加在AI之前,組成“可信的AI”。強調AI技術可信,既與AI技術本身的神奇有關,還是現(xiàn)代氣象科學本身“物理求真”的傳統(tǒng)使然。
2021年10月,歐洲中期天氣預報中心(ECMWF)和歐空局(ESA)共同主持召開了“地球系統(tǒng)觀測和預報中的機器學習研討會”。會上來自ECMWF的學者介紹了ML在該機構的發(fā)展情況。未來10年,ML會在全業(yè)務鏈得到應用,按照應用從弱到強分布的領域為:觀測篩選(observation screening)、后處理應用、模式輸出特征研判(feature detection)、同化偏差糾正、參數(shù)化方案仿真、模式的觀測學習分量(learn model components from observation)和學習運動方程(learn equations of motion)。這些應用領域,如果說前面幾項針對預報業(yè)務,還僅僅是改進意義上的發(fā)展,ML強介入的最后三項則具備顛覆性的意義:即以經典力學和熱力學為支撐的預報系統(tǒng)中的參數(shù)化方案、模式分量乃至運動(動力)方程,都可以通過ML技術,基于已有預報系統(tǒng)的預報和觀測結果重新打造。
報告人隨后介紹了“自下到上”和“從上到下”兩種打造方法,前者強調了基于物理的ML、可信的AI、混合模式和不確定性量化等科學概念和領域。這里,學者指出針對天氣和氣候應用,需要建設定制的ML解決方案,而方案中強調“trustworthy”,無疑是針對AI技術的“灰色”甚至“黑色”的本質,畫出了底線。
與歐洲學者相呼應,美國國家科學基金(NSF)在其最新AI戰(zhàn)略布局中,以強強聯(lián)合方式成立了“天氣、氣候和沿海海洋可信的AI研究所”(AI Institute for Research on Trustworthy AI in Weather, Climate, and Coastal Oceanography,AI2ES)。AI2ES匯集了來自俄克拉何馬大學等7所高校,谷歌、IBM、NVIDIA等4家高技術企業(yè)和NCAR及NOAA等聯(lián)邦機構的研究實體,扛起了在環(huán)境科學領域提倡“trustworthy”AI的大旗。2021年,NCAR學者在一次學術會上解釋AI2ES要發(fā)展可信的AI技術的宗旨時,先提出了ML是否是面對未來氣象挑戰(zhàn)的“高招”(Silver Bullet)的問題。他問道:為什么可解釋的AI非常重要?回答這個問題時,NCAR學者引用了系列科幻小說《銀河系漫游指南》作者道格拉斯·亞當斯的回答:42①在亞當斯的經典科幻小說《銀河系漫游指南》中,一臺名為“深思”(Deep Thought)的超級計算機經過700萬年的思考,得出了關于“生命、宇宙和萬事萬物終極問題”的答案,這個答案就是“42”。巧合的是,42在數(shù)學領域具有許多特殊的意義。其中之一便是2019年由MIT的Andrew Sutherland和布里斯托大學的Andrew Booker領導的團隊解開了著名的數(shù)學難題——丟番圖方程(Diophantine Equation)x3+y3+z3=k中最難以琢磨的數(shù)字k=42的解。這個由三個立方組成的難題于1954年在劍橋大學被首次提出。對于較小的數(shù)字,這類方程比較容易求解:例如,29可以寫成33+13+13,而32是不可解的。在1~100之中,除了33和42之外,所有問題最終都通過各種技術和超級計算機解決,或者被證明是無法解決的。Booker設計了一個巧妙的算法用布里斯托大學的超算花了幾個星期的時間算出了33的一個解決方案。但對于求解42他發(fā)現(xiàn)所需的計算量要高一個數(shù)量級,可能超出了超級計算機的能力。在嘗試破解33時,搜索界限是1016,但對于破解42來說需要將搜索界限設置為1017。通過UK-based Charity Engine的幫助,他們從遍布世界各地的40多萬名志愿者的家用電腦中獲得計算能力,最終得到了x3+y3+z3=42的第一種解決方案:42 = (-80538738812075974)3 + 804357581458175153+126021232973356313。目前,在101~1000中還有10個數(shù)字尚未被破解;另外,對于k=3是否存在更多解,也是人們關注的一個方向。,即關于生命、宇宙和一切事情的終極問題的答案(“The ultimate answer to life, the universe and everything is...42!”)。
學者引用科幻作家的終極答案,實際上并沒有多少調侃的意味,他實際上也在負責任地提出AI2ES需要面對的:what are the limitations/ boundaries of this silver bullet?(這一高招的局限和邊界在哪里?)。完整回答這個問題,“可信的”要素完全不可喪失,這也是為什么在AI2ES的LOGO(附圖)中,與人工智能和環(huán)境科學并列的第三個關鍵詞,選擇了Risk Communication(風險溝通),在更現(xiàn)實的意義上,點出了環(huán)境學者在引入AI時要有的意識。
ML和NN等AI技術,已經成為氣象科技發(fā)展重要因素和變數(shù),要發(fā)展與氣象預報這一與國計民生密切相關領域的、融合了AI的新技術,“trustworthy”或許是我們選擇、改進和應用各種AI技術的前提。堅持這樣的前提,不可或缺的做法之一,就是更加準確、科學地定義或再定義融入了各種AI技術的新術語,例如:De-biasing Techniques(消偏技術)、Fast linearised models for DA(快速線性化DA模式)、Fast Emulation of Parameterisations(參數(shù)化快速仿真)、Data driven Parameterisations(數(shù)據(jù)驅動參數(shù)化)和Non-linear Ensemble Averaging(非線性集合平均)等。
Advances in Meteorological Science and Technology2022年1期