李正鵬,潘承毅,鄔陽(yáng)陽(yáng)
(1.云南工商學(xué)院智能科學(xué)與工程學(xué)院,云南 昆明 650000;2.麗江文化旅游學(xué)院信息學(xué)院,云南 麗江 674100)
科學(xué)決策制定的前提是預(yù)測(cè),但影響預(yù)測(cè)結(jié)果精確度的因素眾多,在預(yù)測(cè)中不可避免地會(huì)出現(xiàn)預(yù)測(cè)結(jié)果不精確的情況。影響預(yù)測(cè)結(jié)果精確性的一個(gè)重要因素是預(yù)測(cè)方法,為了提高預(yù)測(cè)結(jié)果的精確度,一些學(xué)者不斷改進(jìn)和提出新的預(yù)測(cè)方法。這些預(yù)測(cè)方法大致可以分為定性預(yù)測(cè)方法和定量預(yù)測(cè)方法兩大類(lèi),常見(jiàn)的定量預(yù)測(cè)方法有:時(shí)間序列分析法、回歸分析法、灰色預(yù)測(cè)法、人工神經(jīng)網(wǎng)絡(luò)法以及組合預(yù)測(cè)法等[1]。其中,基于人工神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法不僅適用于處理大批量數(shù)據(jù),還具有一定的魯棒性和容錯(cuò)性,能更好地進(jìn)行預(yù)測(cè),在各個(gè)領(lǐng)域的預(yù)測(cè)中得到了廣泛應(yīng)用。伴隨著人工智能的發(fā)展,新的神經(jīng)網(wǎng)絡(luò)算法也不斷被提出,經(jīng)典的人工神經(jīng)網(wǎng)絡(luò)模型也不斷得到擴(kuò)展和優(yōu)化,基于不同類(lèi)型神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法也不斷地應(yīng)用到預(yù)測(cè)中。一些研究學(xué)者對(duì)人工神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)中的應(yīng)用現(xiàn)狀進(jìn)行了歸納總結(jié)。
彭顯剛等[2]指出,徑向基函數(shù)(RadialBasisFunction,RBF) 神經(jīng)網(wǎng)絡(luò)比傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)能力更強(qiáng),預(yù)測(cè)結(jié)果的精確度也更高,在短期負(fù)荷預(yù)測(cè)中的應(yīng)用更為廣泛,并對(duì)短期負(fù)荷預(yù)測(cè)中的RBF神經(jīng)網(wǎng)絡(luò)應(yīng)用進(jìn)行了系統(tǒng)概述,從模型改進(jìn)、負(fù)荷數(shù)據(jù)的篩選以及結(jié)合實(shí)際對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化這3 個(gè)方面對(duì)RBF 神經(jīng)網(wǎng)絡(luò)在短期負(fù)荷預(yù)測(cè)中的應(yīng)用進(jìn)行了探討。張為夢(mèng)[3]對(duì)短時(shí)道路交通流預(yù)測(cè)中的神經(jīng)網(wǎng)絡(luò)方法進(jìn)行了總結(jié),文獻(xiàn)主要介紹了4 種神經(jīng)網(wǎng)絡(luò)的應(yīng)用,即:基于誤差反向傳播(Back Propagation,BP) 神經(jīng)網(wǎng)絡(luò)模型、小波神經(jīng)網(wǎng)絡(luò)(Wavelet Neural Network,WNN)、RBF 神經(jīng)網(wǎng)絡(luò)、廣義回歸神經(jīng)網(wǎng)絡(luò)(Generalized Regression Neural Network,GRNN) 的預(yù)測(cè)方法在短時(shí)道路交通預(yù)測(cè)中的應(yīng)用,提出了研究過(guò)程中存在的問(wèn)題。主成分分析(Principal Component Analysis,PCA) 又稱(chēng)主分量分析,何慧等[4]以PCA-BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法、RBF 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法、WNN 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法、基于遺傳算法的BP 網(wǎng)絡(luò)預(yù)測(cè)方法、粒子群優(yōu)化算法(Particle Swarm Optimization,PSO) 為分類(lèi)標(biāo)準(zhǔn),對(duì)人工神經(jīng)網(wǎng)絡(luò)在月降水量預(yù)測(cè)業(yè)務(wù)中應(yīng)用進(jìn)行概述,并重點(diǎn)總結(jié)和分析了神經(jīng)網(wǎng)絡(luò)在廣西月降水量預(yù)測(cè)的應(yīng)用。上述文獻(xiàn)綜述總結(jié)和分析了人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法在某個(gè)具體領(lǐng)域中的應(yīng)用,而關(guān)于人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法的應(yīng)用總結(jié)還不太全面,本文對(duì)常用的基于人工神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法和應(yīng)用進(jìn)行總結(jié)和分析,以期為研究者繼續(xù)深入研究提供有益借鑒。
1986 年,BP 神經(jīng)網(wǎng)絡(luò)這一模型被提出,該模型不僅具有較強(qiáng)的容錯(cuò)能力,同時(shí)還有比較好的非線(xiàn)性映射能力,在許多領(lǐng)域都得到了廣泛應(yīng)用。BP神經(jīng)網(wǎng)絡(luò)模型具體的學(xué)習(xí)過(guò)程是,輸入的信號(hào)先經(jīng)過(guò)隱含層處理,最后到輸出層,輸出的結(jié)果如果誤差不符合要求,則將誤差進(jìn)行反向傳播,并據(jù)此修改網(wǎng)絡(luò)的閾值和權(quán)值,直到達(dá)到設(shè)定的標(biāo)準(zhǔn)或達(dá)到最大訓(xùn)練次數(shù)[5]。
周佳俊等[6]經(jīng)研究發(fā)現(xiàn),在農(nóng)藥殘留預(yù)測(cè)中,預(yù)測(cè)模型的限制導(dǎo)致無(wú)法考慮多種因素(溫度、降水量、施藥時(shí)間等) 對(duì)農(nóng)藥降解的影響,針對(duì)這一問(wèn)題,將BP 神經(jīng)網(wǎng)絡(luò)算法應(yīng)用到農(nóng)藥殘留的預(yù)測(cè)中,并結(jié)合主成分分析法對(duì)影響因子進(jìn)行分析,得到的預(yù)測(cè)結(jié)果總擬合優(yōu)度判定系數(shù)為0.962 05,有著較好的預(yù)測(cè)精度。蘇顏等[7]認(rèn)為,電力調(diào)度機(jī)構(gòu)對(duì)短期負(fù)荷預(yù)測(cè)的精度要求越來(lái)越高,于是使用基于BP 神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法對(duì)電力負(fù)荷進(jìn)行了短期預(yù)測(cè),為進(jìn)一步驗(yàn)證該方法的有效性和準(zhǔn)確性,將預(yù)測(cè)結(jié)果同基于自適應(yīng)算法、基于L-M 算法的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,發(fā)現(xiàn)使用BP 神經(jīng)網(wǎng)絡(luò)方法進(jìn)行預(yù)測(cè)能夠得到更準(zhǔn)確的預(yù)測(cè)結(jié)果。曾麗芳等[8]指出,股票數(shù)據(jù)同時(shí)具有時(shí)變性和非線(xiàn)性?xún)蓚€(gè)特征,而傳統(tǒng)的時(shí)間序列預(yù)測(cè)方法無(wú)法較好地處理非線(xiàn)性數(shù)據(jù),基于此,建立了BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型、ARI-MA(6,1,6) 預(yù)測(cè)模型對(duì)股票價(jià)格進(jìn)行預(yù)測(cè),將預(yù)測(cè)結(jié)果和使用PCA-BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型、GA-BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,發(fā)現(xiàn)使用GA-BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型得到的結(jié)果具有更小的誤差。
1988 年,Moody 和Darken 兩位研究者設(shè)計(jì)了RBF 神經(jīng)網(wǎng)絡(luò)。RBF 神經(jīng)網(wǎng)絡(luò)性不僅有著很強(qiáng)的非線(xiàn)性擬合能力,同時(shí)學(xué)習(xí)收斂速度快,是一種性能良好的前向網(wǎng)絡(luò)。RBF 神經(jīng)網(wǎng)絡(luò)包括輸入層、隱含層和輸出層3 層結(jié)構(gòu),隱含層將向量從低維度映射到高緯度,從而解決低維度線(xiàn)性不可分的問(wèn)題。RBF 神經(jīng)網(wǎng)絡(luò)中,輸入層到隱含層的空間映射是非線(xiàn)性的,從隱含層到輸出層空間映射是線(xiàn)性的[9]。
劉銀波等[10]對(duì)國(guó)內(nèi)外船舶電力負(fù)荷預(yù)測(cè)進(jìn)行了研究,發(fā)現(xiàn)早期的預(yù)測(cè)主要使用的是回歸分析法與時(shí)間序列法這兩種方法,于是設(shè)計(jì)了基于RBF 神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法,對(duì)選取研究對(duì)象的歷史負(fù)荷數(shù)據(jù)進(jìn)行分析,并通過(guò)仿真實(shí)驗(yàn)驗(yàn)證該方法的可靠性,發(fā)現(xiàn)相對(duì)誤差在0.1~-0.2 之間,預(yù)測(cè)效果較好。王瑞等[11]考慮到積溫效應(yīng)對(duì)相似日的選擇也有一定的影響,通過(guò)計(jì)算綜合相似度來(lái)選擇相似日,同時(shí)對(duì)RBF 神經(jīng)網(wǎng)絡(luò)在電力負(fù)荷預(yù)測(cè)中的應(yīng)用進(jìn)行了研究,發(fā)現(xiàn)以往的模型都是針對(duì)大樣本數(shù)據(jù),于是使用模糊C-means 算法對(duì)相似日樣本進(jìn)行處理,以此來(lái)優(yōu)化RBF 神經(jīng)網(wǎng)絡(luò)的隱含層參數(shù),將預(yù)測(cè)結(jié)果與其他預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,結(jié)果顯示該方法提高了預(yù)測(cè)精確度。高磊等[12]指出,普通的PSORBF 神經(jīng)網(wǎng)絡(luò)算法比RBF 神經(jīng)網(wǎng)絡(luò)算法在處理數(shù)據(jù)時(shí)表現(xiàn)更好,但是無(wú)法避免出現(xiàn)局部最優(yōu)的狀況,基于此,將模擬退火算法、粒子群算法和RBF神經(jīng)網(wǎng)絡(luò)相結(jié)合,提出了一種混合PSO-RBF 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,并對(duì)巖爆進(jìn)行預(yù)測(cè),將得到的預(yù)測(cè)結(jié)果和使用RBF 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法、普通的PSORBF 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法得到的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,結(jié)果顯示,基于混合PSO-RBF 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的預(yù)測(cè)結(jié)果更為可靠。
1992 年,Zhang Qinghua 等正式提出了WNN 的概念,此神經(jīng)網(wǎng)絡(luò)是將小波分析理論和人工神經(jīng)網(wǎng)絡(luò)相結(jié)合的一種前饋神經(jīng)網(wǎng)絡(luò)。小波理論和人工神經(jīng)網(wǎng)絡(luò)的結(jié)合有兩種方式,一是輔助性結(jié)合,二是緊密型結(jié)合[13]。WNN 和BP 神經(jīng)網(wǎng)絡(luò)相比,可以簡(jiǎn)化訓(xùn)練,在人工智能、機(jī)器人、統(tǒng)計(jì)學(xué)等很多領(lǐng)域都有著廣泛的應(yīng)用。
李明柱等[14]對(duì)暖通空調(diào)系統(tǒng)短期熱負(fù)荷預(yù)測(cè)進(jìn)行了研究,發(fā)現(xiàn)BP 模型在建筑負(fù)荷預(yù)測(cè)中已有廣泛應(yīng)用,但效果不理想,結(jié)合暖通空調(diào)負(fù)荷數(shù)據(jù)呈現(xiàn)的隨機(jī)性和非線(xiàn)性,提出小波神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法,通過(guò)小波分解與重構(gòu)來(lái)提高擬合度,通過(guò)對(duì)比,WNN 預(yù)測(cè)方法的預(yù)測(cè)精度和穩(wěn)定性都高于BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法。鄭方圓等[15]指出,傳統(tǒng)機(jī)器學(xué)習(xí)算法進(jìn)行回歸訓(xùn)練時(shí)未考慮到突發(fā)情況對(duì)飛行到達(dá)時(shí)刻的影響,導(dǎo)致信息預(yù)測(cè)不準(zhǔn)確,所以考慮采用ADS-B 數(shù)據(jù)來(lái)替換傳統(tǒng)雷達(dá)數(shù)據(jù),并采用WNN預(yù)測(cè)模型來(lái)進(jìn)行模擬仿真,通過(guò)對(duì)預(yù)測(cè)值和實(shí)際值比較發(fā)現(xiàn),WNN 預(yù)測(cè)模型能對(duì)突變數(shù)據(jù)做出快速反應(yīng),得到更準(zhǔn)確預(yù)測(cè)數(shù)據(jù)。鄺先驗(yàn)等[16]在進(jìn)行公交到站時(shí)間預(yù)測(cè)的研究時(shí)發(fā)現(xiàn),傳統(tǒng)統(tǒng)計(jì)學(xué)方法、機(jī)器學(xué)習(xí)方法抗干擾能力差,無(wú)法對(duì)復(fù)雜多變的交通情況做出快速響應(yīng),因此提出天牛須(Beetle Antennae Search,BAS) 小波神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,該預(yù)測(cè)模型結(jié)合天牛須搜索算法,提高了尋優(yōu)速度,對(duì)仿真實(shí)驗(yàn)結(jié)果進(jìn)行比較發(fā)現(xiàn),BAS-WNN 預(yù)測(cè)模型的預(yù)測(cè)精度和穩(wěn)定性均強(qiáng)于WNN 預(yù)測(cè)模型和Elman 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型。
長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long Short Term Memory Network,LSTM) 是一種特殊的RNN 模型,是Hochreiter 和Schmidhuber 在1997 年設(shè)計(jì)出來(lái)的,主要是解決RNN 模型中存在的梯度消失或梯度爆炸問(wèn)題,提高解決長(zhǎng)期依賴(lài)關(guān)系的能力[17]。
班文超等[18]指出,經(jīng)典潮汐調(diào)和分析預(yù)測(cè)方法需要大量的數(shù)據(jù)支撐,在短期潮位預(yù)測(cè)中表現(xiàn)不好,針對(duì)這個(gè)問(wèn)題,提出了深層神經(jīng)網(wǎng)絡(luò)LSTM 預(yù)測(cè)模型,并對(duì)長(zhǎng)短期預(yù)測(cè)結(jié)果進(jìn)行對(duì)此,結(jié)果顯示,神經(jīng)網(wǎng)絡(luò)LSTM 預(yù)測(cè)模型在長(zhǎng)短期預(yù)測(cè)中的精確度都很高,可以有效克服經(jīng)典潮汐調(diào)和分析預(yù)測(cè)方法在短期預(yù)測(cè)中預(yù)測(cè)結(jié)果不準(zhǔn)確的問(wèn)題。李麗萍等[19]指出,無(wú)論是傳統(tǒng)的時(shí)間序列方法還是傳統(tǒng)的機(jī)器學(xué)習(xí)方法在股票加個(gè)預(yù)測(cè)中表現(xiàn)效果都不理想,同時(shí)考慮到股票數(shù)據(jù)的特性,建立了基于LSTM 神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型,將預(yù)測(cè)結(jié)果和BP 神經(jīng)網(wǎng)絡(luò)和Elman 神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果相比較,結(jié)果表明,基于LSTM 神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型預(yù)測(cè)結(jié)果更接近真實(shí)值。曹文治等[20]認(rèn)為,傳統(tǒng)預(yù)測(cè)方法計(jì)算簡(jiǎn)單,但計(jì)算結(jié)果的精確度不高,人工智能預(yù)測(cè)方法可以提高預(yù)測(cè)精度,同時(shí)考慮到水質(zhì)指標(biāo)濃度數(shù)據(jù)具有時(shí)序相關(guān)性,構(gòu)建了EEMD-LSTM-SVR 組合預(yù)測(cè)模型,預(yù)測(cè)結(jié)果同單一的LSTM 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法的預(yù)測(cè)結(jié)果相比,具有更高的精確度。
1998 年,YannLecun 等人提出了Let Net 模型,標(biāo)志著卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN) 的形成。CNN 成功的關(guān)鍵原因是采用了局部連接和權(quán)值共享方式,這種方式減少了權(quán)值的數(shù)量,降低了復(fù)雜度,同時(shí)還減少了過(guò)擬合的風(fēng)險(xiǎn)[21]。
陳建平等[22]指出,煤層底板突水受含水層、隔水層、開(kāi)采條件等多種因素影響,并采用卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)煤層底板突水進(jìn)行預(yù)測(cè),并將預(yù)測(cè)結(jié)果與基于BP 神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)方法和基于LeNet-5模型預(yù)測(cè)方法得到的結(jié)果進(jìn)行對(duì)比,可以看出,卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的準(zhǔn)確率和誤差率都優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型和LeNet-5 模型。王安義等[23]指出,以往對(duì)礦井巷道場(chǎng)強(qiáng)預(yù)測(cè)模型,包括三維射線(xiàn)跟蹤法、單斜率和雙斜率模型、基于支持向量機(jī)模型等預(yù)測(cè)效果都不理想,提出一種改進(jìn)的CNN 場(chǎng)強(qiáng)預(yù)測(cè)模型,該模型在傳統(tǒng)CNN 的卷積層后加入BN 層代替池化層,從而避免了網(wǎng)絡(luò)的過(guò)度擬合,實(shí)現(xiàn)網(wǎng)絡(luò)快速收斂,結(jié)果顯示,改進(jìn)的CNN 預(yù)測(cè)模型有效提高了預(yù)測(cè)精度。李珊珊等[24]經(jīng)過(guò)研究得出,潛在蒸散量的準(zhǔn)確性對(duì)灌溉決策起著關(guān)鍵作用,以往計(jì)算潛在蒸散量的P-M 方法、隨機(jī)森林、廣義回歸神經(jīng)網(wǎng)絡(luò)估算等都存在一定局限性,針對(duì)這個(gè)問(wèn)題,提出CNN-BiLSTM 融合模型,該模型結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)在局部結(jié)構(gòu)特征提取方面的優(yōu)勢(shì)以及雙向長(zhǎng)短期記憶網(wǎng)絡(luò)對(duì)非線(xiàn)性時(shí)序優(yōu)秀的處理能力,有效提高了蒸散量的預(yù)測(cè)精度。
通過(guò)對(duì)幾類(lèi)神經(jīng)網(wǎng)絡(luò)的特點(diǎn)或優(yōu)點(diǎn)進(jìn)行概述,重點(diǎn)對(duì)基于BP 神經(jīng)網(wǎng)絡(luò)、RBF 神經(jīng)網(wǎng)絡(luò)、WNN、LSTM 神經(jīng)網(wǎng)絡(luò)、CNN 預(yù)測(cè)方法的應(yīng)用進(jìn)行了歸納總結(jié)。通過(guò)總結(jié)和分析可以發(fā)現(xiàn),很多神經(jīng)網(wǎng)絡(luò)模型都應(yīng)用在了預(yù)測(cè)中,并取得了很好的預(yù)測(cè)效果。神經(jīng)網(wǎng)絡(luò)算法應(yīng)用到預(yù)測(cè)中一般可以分為3 種類(lèi)型:一是將神經(jīng)網(wǎng)絡(luò)模型直接應(yīng)用到一種新的場(chǎng)景;二是將優(yōu)化算法和神經(jīng)網(wǎng)絡(luò)結(jié)合進(jìn)行預(yù)測(cè);三是將神經(jīng)網(wǎng)絡(luò)模型和其它類(lèi)型的評(píng)價(jià)模型結(jié)合,進(jìn)行組合預(yù)測(cè)。
人工神經(jīng)網(wǎng)絡(luò)模型應(yīng)用到預(yù)測(cè)中可以建立新的預(yù)測(cè)模型,得到的預(yù)測(cè)結(jié)果也更為準(zhǔn)確。同時(shí),神經(jīng)網(wǎng)絡(luò)可以處理大規(guī)模數(shù)據(jù),這個(gè)特點(diǎn)使得神經(jīng)網(wǎng)絡(luò)在大數(shù)據(jù)時(shí)代中進(jìn)行預(yù)測(cè)的應(yīng)用更為廣泛。深度學(xué)習(xí)理論還在不斷發(fā)展,不斷有學(xué)者對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化和改進(jìn),也不斷有新的模型被提出,將這些模型及時(shí)引入到預(yù)測(cè)應(yīng)用中可以創(chuàng)新預(yù)測(cè)方法,有時(shí)還可以得到更好的預(yù)測(cè)結(jié)果。另外,組合預(yù)測(cè)也是一個(gè)重要的研究方向,將神經(jīng)網(wǎng)絡(luò)和其他預(yù)測(cè)模型相結(jié)合,可以提高預(yù)測(cè)結(jié)果的精確度。