李潔
(廣西科技師范學院 數學與計算機科學學院,廣西 來賓546199)
降雨是一種常見的自然現象,一個地區降雨量的多少直接影響和制約著國民經濟的發展和生產生活安全。近年來,水災和旱災導致的國民經濟損失日益加大。因此,為了有效防治、管理和控制災情,準確的降水預報具有現實的指導意義[1]。
然而,降雨自然現象的形成是一個復雜的過程,受地表、溫度、濕度、人文因素等多種因素影響,使得預測變得更加困難。單層前饋神經網絡(SLFN)以其良好的學習能力在許多領域得到了廣泛的應用,然而傳統的學習算法,具有訓練速度慢,容易陷入局部最小值,學習率敏感等特點[2]。本文采用一種新的SLFN 的算法——極限學習機(ELM)對廣西降雨歷史資料進行訓練建模預測,通過計算預測結果的均方根誤差進行模型評估。

其中,wi和bi是隱藏層節點參數,g(wi,bi,x)是激活函數,該函數是一個滿足ELM 通用逼近能力定理的非線性分段連續函數,本模型使用Sigmoid 函數,故g 函數為:

極限學習機(ELM)是一種針對單隱含層前饋神經網絡(Single-hidden Layer Feedforward Neural Network,SLFN)的新算法。由三層節點構成,分別為輸入層、隱含層和輸出層。其結構如圖1 所示。
將wix+bi代入公式x 即可。
數據經隱層后進入輸出層,根據圖1 及公式,則用于“廣義”的單隱藏層前饋神經網絡ELM 的輸出是:

ELM 訓練SLFN 可分為兩個主要階段:
1.2.1 隨機特征映射
初始化隨機產生輸入層權重和隱藏層偏置,利用一些非線性映射作為激活函數,將輸入數據映射到一個新的特征空間。與傳統的BP 神經網絡相比,ELM 隱藏層節點參數ω 和b 根據任意連續的概率分布隨機生成,與訓練數據無關,而不是經過訓練確定的,從而在相比在效率上占有較大優勢。隨機確定好參數ω 和b 后,根據公式(1)和(2)計算出隱層輸出H。
1.2.2 線性參數求解
為了得到在訓練樣本集上的較好β, 需要保證訓練誤差最小。采用網絡輸出Hβ 與樣本期望輸出T 的最小誤差平方和最小為目標函數,對連接隱藏層和輸出層權值β 進行求解,目標函數為:

其中H 是隱藏層的輸出矩陣,T 是訓練數據的目標矩陣:

由矩陣論得公式(5)的最優解為:

其中H+為矩陣H 的廣義逆矩陣。當H+H 為非奇異時使用正交投影法,利用公式(8)即可求解得H 的廣義逆矩陣H+。

本文選取廣西三區2003-2008 年這6 年期間5 月份廣西水文監測站點監測到的實際測量因子作為實驗樣本,用2003-2007 前5 年5 月的數據(包括30 個輸入因子,1 個輸出)作為ELM 訓練樣本,預報三區2008 年5 月的逐日降水量。
將五月三區的179 個數據樣本分成兩組,前148 個用于訓練,后31 個用于測試。將數據標準化處理,歸一到單位方差和零方差。隨機產生偏差,置隱層節點數50,采用公式(3)作為激活函數,將148 個訓練樣本輸入到ELM 網絡模型,訓練出權重,用訓練得到的權重計算出31 個測試樣本的輸出值。
圖2 是ELM 對前148 個樣本的模型擬合效果。圖3 是后31個樣本,即2008 年5 月31 天逐日預報效果及每天誤差值。圖中,Actual rainfall 代表站點實測雨量,ELM fitting 代表樣本擬合 值,ELM prediction 是ELM 模 型 預 測 值,t213 prediction 是T213 模式預報值。

圖2 ELM 對5 月三區148 個建模樣本擬合效果
為分析模型優劣,將ELM 模型結果T213 模式進行分析對比,表1 給出預測2008 年5 月三區結果的各項指標。

圖3 ELM 模型對5 月三區31 天的逐日預報對比及誤差對比

表1 ELM 預報與T213 預報的各項指標誤差對比分析
從表1 可以看出,本文建立ELM 模型在均方根誤差、最大絕對誤差兩個重要衡量指標上,均優于T213 模式。ELM 模型能獲得更好的預測結果,預測精度較高。
結束語
可見,即使隨機生成隱藏層節點及偏置,ELM 仍保持了SLFN 的通用逼近能力。實驗結果表明,極限學習機具有訓練參數少、學習速度快、泛化能力強的優點,用在降雨氣象建模上具有良好的效果。后續研究中為進一步提高傳統極限學習機的穩定性和泛化能力,可以考慮優化等式約束的極限學習機,在目標函數中增加權值范數的約束項來重新求解輸出權重。