一種隨機配置網絡的模型與數據混合并行學習方法

2021-12-01 08:25:40李德鵬楊春雨馬小平

自動化學報 2021年10期

關鍵詞：模型

代偉李德鵬楊春雨馬小平

信息技術的迅速發展使得生產制造行業進入大數據時代,這為數據建模提供了大量的數據樣本,使得數據驅動建模在不同領域產生廣闊的應用空間[1?3].然而,系統復雜度和數據規模的日益增大為數據建模算法帶來新的挑戰.模型精度取決于樣本的質量與數量,但超過一定規模的樣本數據,會顯著增加網絡參數訓練與優化的成本,且難以有效學習,導致模型的整體性能下降[4].在采用傳統神經網絡算法進行大數據建模時,所得到的模型往往存在訓練耗時、網絡結構復雜等問題,難以滿足實際應用的需求.因此,建立一種能夠從大量數據中快速、高效學習的策略具有重要意義.

上世紀90 年代,文獻[5]提出的隨機向量函數鏈接網絡,與文獻[6]提出的另一種具有隨機權值的單層前饋神經網絡等被統稱為隨機權神經網絡(Random weight neural networks,RWNNs)[7?8].其特征在于隱含層參數(輸入權值和偏置)在給定的區間內隨機產生,只需解析求解網絡輸出權值.因RWNNs 實現簡單、建模速度快等優勢受到了廣泛的關注.文獻[9]設計了一種二維RWNNs 分類器,用于人臉識別,其使用兩組輸入權值直接以特征矩陣作為輸入而不用轉換成向量形式,能夠有效保留圖像數據的空間信息,具有良好的分類性能.文獻[10]將非參數的核密度估計方法與加權最小二乘估計引入到RWNNs 的學習算法,通過評估每個訓練樣本對于建模的貢獻度來抑制噪聲數據或離群點的負面影響,從而建立了魯棒RWNN 以及在線學習算法.在此基礎上,文獻[11]進一步引入正則項來防止過擬合現象,有效減小輸出權值,在一定程度上降低了模型復雜度.然而,兩個本質缺陷使得RWNNs的應用受到一定的限制:1)隱含層節點數不能先于訓練而確定,即難以設定合適的網絡結構;2)隱含層參數在固定不變的區間內產生,影響其實際逼近特性[12?13].

為了解決上述問題,Wang 等首次提出了一種隨機增量學習技術,即隨機配置網絡(Stochastic configuration networks,SCNs)[14].SCNs 在一個可調區間內隨機分配隱含層參數,并創新性地引入監督機制加以約束,確保了其無限逼近特性.作為一種增量學習算法,SCNs 在每次的增量學習過程中,均建立候選“節點池”以選出最佳節點,加快了收斂速度;同時,網絡結構也可在增量學習過程中確定.針對SCNs 監督機制中關鍵參數的選擇問題,文獻[15]指導性地給出了兩種不等式約束,從而提高了隨機參數配置的效率,有助于候選“節點池”的建立.文獻[16]以SCNs 作為基模型,采用負相關學習策略來配置輸出權值,提出了一種快速解除相關異構神經元的集成學習方法.文獻[17]針對隱含層輸出矩陣可能存在的多重共線性等不適定情況,在計算輸出權值時采用截斷奇異值分解對重新構建的輸出矩陣進行廣義逆運算,建立了TSVD-SCN 模型.文獻[18]通過引入正則化技術,進一步提升SCNs 的泛化性能.文獻[19] 通過理論分析和算法實現將SCNs 推廣到深度結構,即DeepSCNs.結果表明,相比其他深度神經網絡,DeepSCNs 可以快速有效地生成,且學習特性和泛化性能之間具有一致性.此外,文獻[20]和[21]分別提出了兩種不同的魯棒SCNs 算法用于受污染數據的建模問題.

然而,現有的SCNs 及其相關算法均采用點增量的構建方式.在大數據建模任務中,往往需要大量的迭代和耗時的偽逆運算.為解決采用傳統計算方式將產生過大計算損耗的問題,本文研究SCNs并行學習方法,以提高SCNs 在大數據應用中的效率.

現有面向大數據的神經網絡并行建模的研究成果可分為數據或者模型并行兩類[22?24].數據并行是將數據集分成若干數據塊以同時處理,模型并行是將參數進行并行劃分以同時求解.本文針對SCNs增量學習過程中網絡結構動態變化的特點,提出一種新穎的模型與數據混合并行的增量學習方法.主要貢獻在于:將點增量和塊增量兩種增量模型構建方法進行并行,左側為點增量SCN (PSCN),右側為塊增量SCN (BSCN).其中,PSCN 每次迭代隱含層節點單個增加,以準確地找到最佳網絡結構,BSCN 每次迭代隱含層節點按塊添加,具有較快的收斂速度.同時針對樣本數據維數高、數據量大導致的計算耗時問題,采用一種基于動態分塊策略的數據并行方法,其在增量學習過程的不同階段,根據當前節點數將訓練數據劃分為不同的數據塊,從而采用并行計算方式,同步進行運算;然后,在PSCN 與BSCN 計算輸出權值時整合數據塊,并通過比較殘差,擇優選取模型參數.對所形成的混合并行隨機配置網絡(Hybrid parallel stochastic configuration networks,HPSCNs)進行對比實驗,結果表明,其具有資源利用率高、建模速度快、網絡模型緊致等優點.

1 增量式隨機權網絡

1.1傳統RWNNs

對于給定的N組訓練集樣本 (xi,ti),其輸入X={x1,x2,···,xN},xi={xi,1,···,xi,d}∈Rd,相應的輸出T={t1,t2,···,tN},ti={ti,1,···,ti,m}∈Rm.其中i=1,2,···,N.具有L個隱含層節點的RWNNs 模型可以表示為:

其中,gj(·)表示隱含層第j個節點的激活函數,隱含層參數(vj和bj) 分別在區間[?λ,λ]d和[?λ,λ]隨機生成,βj=[βj,1,···,βj,q,···,βj,m]T為隱含層第j個節點與m個輸出節點之間的輸出權值,fL即當前網絡的輸出.模型參數可以通過求解如下的二次型優化問題獲得.

上述等式可以進一步表示為矩陣形式:

其中

為隱含層輸出矩陣,H?為其Moore-Penrose 廣義逆[25].

通常,傳統RWNNs 所需要的節點數往往只能針對特定建模任務采用交叉驗證法確定,實驗過程耗時,且網絡結構的確定取決于交叉驗證時所選擇的參數.

1.2 增量構造學習算法

增量構造學習算法是解決網絡結構的一種有效方法,從隨機產生第一個節點g1=g(v1,b1,x) 開始,向網絡中逐漸增加節點;相應地,輸出權值為β1=〈e0,g1〉/‖g1‖2,其中e0=f;更新e1=f?β1g1[12].通過重復上述過程可以同時解決網絡結構和參數優化問題,增量RWNNs 的構造過程如下.

首先,設定增量學習的期望精度,其輸出fL可以表示為先前網絡fL?1與新增節點gL(vL和bL)的特定組合,即:

其中,新增節點的輸出權值依據下式

且先前網絡的殘差

增量RWNNs 雖然解決了傳統RWNNs 難以確定網絡結構的問題,但網絡的輸入權值和偏置通常選擇在固定區間(如[?1,1])內產生,這種與樣本數據無關的參數設定方式導致RWNNs 的逼近特性具有不確定性.因此,隨機參數的產生應該依賴于建模數據并加以約束.

2 混合并行增量學習方法

SCNs 作為一種先進的隨機學習技術,其本質特征在于隨機產生的輸入權值和偏置需要滿足監督機制,并采用數據依賴策略動態調整隨機區間,有效解決了RWNNs 及其增量構造學習算法的本質缺陷.然而,傳統SCNs 均是采用點增量的方式來構建網絡(PSCN),即一次迭代過程只能添加一個節點.采用這種方法,每一個新增節點都需要重新建模,當所需節點數較多時,網絡的構建就會變得相對復雜、耗時.從特征學習的角度來說,前饋神經網絡從輸入樣本空間去逼近復雜非線性函數的能力很大程度上取決于隱含層的特征映射,即從低維輸入數據到高維特征空間.而節點可以被認為是高維空間的特征.那么,每次只增加一個節點則在很大程度上限制了特征的獲取.因此,使用點增量方法構建SCNs 的過程往往需要較多的迭代,不可避免地增加了計算量、影響了建模效率.鑒于此,我們最近的工作[26]將傳統點增量SCNs 推廣為允許同時添加多個隱含層節點(節點塊)的塊增量網絡(BSCN),用于加快構建過程.

點增量與塊增量算法分別具有網絡結構緊致但收斂速度慢和收斂速度快但模型不緊致的特點.為了進一步提高算法的綜合性能,本文對傳統SCNs進行改進,提出了一種新的混合并行增量學習方法,即:HPSCNs,以應對大數據建模.主要思想是:在同一個建模任務中,使用點和塊兩種增量構建模型方法進行并行學習,且在學習過程中將樣本數據隨學習過程動態劃分為多個數據塊,從而采用并行計算擇優選取模型參數.

2.1 模型并行策略

HPSCNs 由PSCN 和BSCN 組成,以單輸出為例,其模型并行結構如圖1 所示.這里添加節點的過程被稱為迭代.在訓練過程中,PSCN 的構建方式采用點增量方法(隱含層節點每次迭代單個增加),從而保證相對準確地找到最佳隱含層節點;BSCN 的構建方式采用塊增量方法(隱含層節點每次迭代按塊添加),以提高模型的收斂速度.

該策略采用平行網絡并行計算.即在增量學習過程中,平行的PSCN 與BSCN 通過并行計算被獨立地構建;每次迭代結束后,以當前網絡殘差為指標,保留其中較優的網絡,并將其模型參數作為本次迭代的最終結果;同時將該結果賦值給另一個網絡以更新其節點數,然后進行下一次迭代.

2.1.1 PSCN

圖1 所示的模型并行增量學習方法,左側采用傳統點增量隨機配置網絡PSCN,其學習過程約束根據引理1 獲得.

圖1 模型并行結構圖Fig.1 The structure diagram of model parallelism

引理 1[14].令 Γ:={g1,g2,g3,···}表示一組實值函數,span(Γ)表示由 Γ組成的函數空間.假設span(Γ)稠密于L2空間且?g ∈Γ ,0<‖g‖

若激活函數gL滿足下列不等式約束:

并且輸出權值通過式(3) 計算,那么limL→∞‖f?fL‖=0恒成立.

在上述定理中,將式(8)代入(9),可以得到點增量學習的監督機制:

其中,q=1,2,···,m,μL=(1?r)/(L+1).

網絡構建過程簡述如下:

1) 在可調區間內隨機產生隱含層參數 (vL和bL). 將滿足式(10)的節點作為候選節點,并保留最大的ξL,q所對應的隨機參數;

2) 輸出權值β通過公式(3)求解全局最小二乘得到;

3) 計算PSCN 當前訓練殘差eL,判斷是否滿足停止條件.

2.1.2 BSCN

按照塊增量方法,將引理1 進行推廣,有如下引理2.

引理 2[26].給定 0

那么 limL→∞‖f?‖=0恒成立.其中塊寬?k表示第k次迭代中新加入的節點塊;表示第k?1次迭代結束時的訓練殘差;表示第k次迭代時的隱含層輸出塊;且

表示第k次迭代中的輸出權值的中值.

BSCN 的增量學習過程在PSCN 的基礎上,根據式(11)在可調區間內隨機產生新增節點塊(和),從而實現了批量分配隱含層參數和按塊增加隱含層節點.

2.1.3 收斂性分析

模型并行增量學習過程當前網絡節點數為L時,令新增節點數為l∈{1,?k}有:

1) 點增量 (l=1) 時:

2) 塊增量(l=?k)時:

由以上分析可知,式(13)‖eL+l‖?(r+μL+l)‖eL‖2≤0,殘差序列‖eL+l‖單調遞減且有界.進一步地,

注意到 limL→∞μL+l‖eL‖2=0 ,其中limL→∞μL+l=0.根據式(16)可以進一步得到limL→∞‖eL+l‖2=0,即 limL→∞‖eL+l‖=0.因此殘差序列‖eL+l‖單調遞減且收斂于0,說明本文所提HPSCNs 模型具有無限逼近特性.

2.2 數據并行策略

在增量學習過程中,將數據進行分塊處理,以建立一種數據并行計算策略,可進一步提高學習速度.因此,將訓練輸入樣本X、訓練輸出樣本T等分為M塊,即

每個數據塊的隱含層輸出矩陣通過并行計算獲得,第p個數據塊與隱含層輸出矩陣的對應關系:

這里gp,L表示節點數為L時第p個數據塊的隱含層輸出.此時,PSCN 的監督機制為:

相應地,BSCN 的監督機制為:

表示第k次迭代時輸出權值的中值.

根據不同數據規模的學習任務,輸出權值β可由下式計算獲得:

對于大數據建模,這里只考慮N ≥L的情況,因此,數據并行學習方法中的輸出權值可以表示為:

式(23)將不同數據塊整合并得到輸出權值.

注意到,隨著學習過程中隱含層節點數的增加,網絡尺寸逐漸增大,計算負荷也隨之增加,因此,在增量學習過程的不同階段,本文采用動態分塊策略,逐漸增加數據塊數量,以充分利用并行計算資源,提高學習的效率.所形成的數據并行策略如圖2 所示,其中從隱含層到輸入層的連接起到反饋作用,實現數據塊M隨學習過程中隱含層節點數L的增加而變化,具體動態分塊方法如下:

圖2 數據并行策略Fig.2 Strategy of data parallelism

注1.HPSCNs 繼承了原始SCNs 自組織學習的特點,其隱含層節點在監督機制下自主構建,無需采用傳統自組織學習的剪枝等算法即可保證模型的緊致性.此外,HPSCNs 中PSCN 和BSCN 的監督機制分別不同于傳統SCNs 和塊增量SCNs.以PSCN 為例,若根據M個不同的數據塊同步獲取一組隱含層輸出g1,L,···,gp,L,···,gM,L后,直接帶入SCNs 中得到M組滿足條件的不等式約束,盡管該網絡仍具有無限逼近特性,但收斂性會變差.這是因為監督機制的數據依賴特性.每組監督機制只包含當前數據塊的信息而忽略了其他數據塊,不可避免地放寬了約束的作用,導致所得到的輸入權值和偏置"質量"變低,從而影響到模型收斂性.因此,隱含層參數的分配需要考慮全體數據塊.

注2.RWNNs 與SCNs 均直接使用式(3)求解輸出權值,導致廣義逆運算成為構建過程中較為耗時環節,尤其針對大數據建模,即N >>L的情況,則需要對N ×L階的矩陣進行廣義逆運算;而基于數據并行采用式(23),則只需要計算L×L階矩陣的廣義逆,大大降低了計算量.

2.3 HPSCNs 實現步驟

混合并行增量學習算法的具體實現描述如下:

給定訓練輸入X∈RN×d,輸出T∈RN×m.設置增量構建過程中的容忍誤差ε和最大迭代次數kmax;隱含層參數分配區間集Υ={λ1,λ2,···,λend};最大隨機配置次數Tmax;BSCN 中的塊寬 ?k等.

步驟1.初始化訓練集數據分塊數M=M1;

步驟2.開始模型與數據并行學習;

PSCN:

1) 在區間 [?λi,λi]d和 [?λi,λi] 內隨機生成隱含層參數vL和bL,λi∈Υ,i=1,2,···,end;

2) 使用不同數據塊同步獲取PSCN 的隱含層輸出g1,L,···,gp,L,···,gM,L;

3) 根據式(19)建立候選“節點池”,并找出使得ξL,q最大的隨機參數和

4) 根據式(23)整合數據塊并評估PSCN的輸出權值.

BSCN:

1) 在區間 [?λi,λi]?k×d和 [?λi,λi]?k×1內隨機生成隱含層參數v?k和b?k,λi∈Υ,i=1,2,···,end;

2) 使用不同數據塊同步獲取BSCN 的隱含層輸出塊h1,k,···,hp,k,···,hM,k;

3) 根據式(20)建立候選“節點池”,并找出使得ξL,q最大的隨機參數和

4) 根據式(23)整合數據塊并評估BSCN 的輸出權值.

步驟3.計算PSCN 和BSCN 的訓練殘差;

步驟4.通過比較殘差擇優選取模型參數并用于更新另一個模型的隱含層節點數L;

步驟5.更新下一次迭代中訓練數據的分塊數M=Mk+1(L);

步驟6.重復上述步驟,直至模型達到停止標準;

步驟7.返回最終模型參數v?,b?和β?.

注3.神經網絡的模型精度會隨隱含層節點數的增加而逐漸提高,但當節點數過多時會使訓練誤差變小而測試誤差增大,即過擬合現象.本文所提方法達到停止條件時立即結束迭代,不再繼續增加隱含層節點,在一定程度上避免了過擬合現象.

注4.為盡可能地提高學習效率,需要多次隨機配置隱含層參數,以建立候選"節點池",從而尋找出最佳的隱含層節點.Tmax決定著隨機配置隱含層參數的次數,過大增加計算損耗、過小不利于候選“節點池”的建立[14].此外,隱含層參數分配區間集Υ={λ1,λ2,···,λend}可設置從λ1到λend逐漸增長,學習過程從λ1開始逐次選擇.以PSCN 為例:首先在[?λ1,λ1]d和[?λ1,λ1]內隨機生成Tmax組隱含層參數vL和bL,并從后續所建立的候選"節點池"中找出最佳的一組隨機參數和;若候選"節點池"為空,則從參數集Υ中選擇λ2,調節分配區間,進而重復上述步驟.

3 性能評估

本文選取收斂性和緊致性作為衡量模型質量的評價指標.其中收斂性在數值上表現為殘差序列的遞減程度,可采用達到期望容忍誤差時的學習時間來衡量,收斂性好有利于建模的快速性.緊致性表現為網絡尺寸,可采用達到期望容忍誤差時的隱含層節點數來度量,模型不緊致往往包含不必要的冗余節點,不利于泛化性能,且會顯著增加計算空間和硬件實現的成本.此外,采用均方根誤差(Root mean squares error,RMSE)計算建模精度,均值(Mean)和標準差(Standard deviation,Std)則分別用來反映模型性能的平均值和離散程度.

為驗證本文所提混合并行增量學習模型的有效性,將傳統SCNs (SC-III)[14]、塊增量SCNs (BSCI)[26]和混合并行隨機配置網絡(HPSCNs)分別對大數據建模并根據評價指標進行性能評估.仿真實驗在MATLAB 2016a 環境下運行,所用PC 的CPU為i5,3.4 GHz,內存為16 GB RAM.

3.1 建模數據

4 個不同領域的基準數據:DB1 (SGEMM GPU Kernel Performance Data Set)、DB2 (Electrical Grid Stability Simulated Data Set)、DB3(Mv Data Set) 和DB4 (Pole Telecommunications Data Set)來自UCI (University of California at Irvine)[27]和KEEL (Knowledge Extraction based on Evolutionary Learning)[28].

所選數據集信息見表1.針對每個大規模數據,我們隨機選取80 %的樣本作為訓練集,余下的20 %作為測試集.

表1 基準數據集說明Table 1 Specification of benchmark data sets

3.2 比較實驗

在數據預處理階段,輸入輸出樣本均被歸一化至[?1,1].實驗參數設定如下:

最大迭代次數kmax=300;

最大隨機配置次數Tmax=10;

隨機參數范圍λ∈{1,10,50,100,150,200};

學習參數r∈{0.9,0.99,0.999,···};

容忍誤差ε=0.1(DB1 和DB2),ε=0.01(DB3 和DB4);

不同BSCN 每次迭代的塊寬分別取固定值?k=1、3、5;

大規模訓練集分塊基數M0=4,第k次迭代時分塊數遞增區間長度取50,100,150,···,具體對應關系見表2.

表2 分塊數遞增區間長度及其上下界Table 2 Incremental interval length of block number and its upper and lower bounds

因此,根據式(24)可得

為了便于描述,本文以下標的形式表示BSC-I算法中的塊寬,以上下標的形式分別表示HPSCNs中左側隨機配置網絡PSCN 和右側隨機配置網絡BSCN 的塊寬.如BSC-I3表示其每次迭代添加3個隱含層節點;表示本文所提方法中PSCN每次迭代添加1 個隱含層節點,而BSCN 每次迭代添加3 個隱含層節點.需要指出的是,點增量構建方式是塊增量中 ?k取1 的特例.

表3 記錄了不同算法50 次獨立實驗結果的均值和標準差(Mean±Std).通過比較SC-III、BSC-I3和BSC-I5可以看出,隨著塊寬?k取值的增加,達到期望容忍誤差ε時所需要的迭代次數k明顯降低,建模時間t顯著減少,即塊增量的構建方式可以有效加快傳統SCNs 的收斂速度;然而,塊增量SCNs 需要更多的節點數L,導致網絡復雜度增加,不利于模型泛化性能.這是因為從特征學習的角度來說,殘差序列單調遞減,尚未學習的特征也會隨著增量學習的過程減少,然而BSC-I3和BSC-I5在每次迭代中采用固定的塊寬,不可避免地導致了特征(節點)的冗余.尤其在構建過程后期,每次迭代中節點塊對于建模的貢獻近似于單個節點,卻徒增了網絡復雜度.因此,塊增量SCNs 是一種以犧牲模型緊致性為代價的極速建模方法.

表3 不同算法性能比較Table 3 Performance comparison of different algorithms

1)數據并行通過使用動態分塊策略并同步獲取隱含層輸出,加快了候選“節點池”的建立;同時,針對大數據本文所提方法采用式(23)整合數據塊并計算輸出權值,在很大程度上降低了廣義逆運算負擔;

2)模型并行通過單次迭代中PSCN 與BSCN獨立地同步建模,完成當前迭代后選擇獲得殘差較小的模型參數.其中,HPSCNs 中的BSCN 采用塊增量的構建方式,具有較快的收斂性;PSCN 采用點增量的構建方式,從而準確地找到最佳隱含層節點數.模型并行增量學習也有效減少了迭代次數.

為了評估模型的綜合性能,圖3 給出不同算法對數據集DB1-DB4 的建模時間(t)和隱含層節點數(L).其中,t和L均歸一化處理至[0,1],并表示對應性能指標的得分情況.如:在DB1 建模任務中,SC-III 相比其他算法用時最長,其t對應的得分為1、BSC?I5所需節點數最多,其L對應的得分為1.顯然,分數越低,性能越好.因此,由圖3 可以看出,本文所提混合并行增量學習方法具有較好的綜合性能,且最佳.

圖3 不同算法綜合性能比較Fig.3 Comparison of comprehensive performance of different algorithms

3.3 參數討論與選擇

其中nL和nR分別表示每次迭代PSCN 和BSCN貢獻最佳模型參數的次數,則Eff正比于nL.

表4 記錄了HPSCNs 中BSCN 選擇不同塊寬?k時的模型并行情況.可以看出,對于DB1-DB4,隨著 ?k的增加,Eff的數值越來越小,如?k=10時,的Eff最低,此時PSCN 基本上失去了其在模型并行中的作用.因此,考慮模型的綜合性能,使用HPSCNs 進行大數據建模時,其BSCN的塊寬建議取 ?k∈{1,2,3}.

表4 不同塊寬的算法性能比較Table 4 Performance comparison of algorithms with different block sizes

3.4 工業案例

將所提方法應用在典型一段磨礦過程,建立以磨機給礦量、磨機入口給水量和分級機溢流質量濃度為輸入,以磨礦粒度為輸出的軟測量模型.從磨礦半實物仿真平臺[29]中采集20 000 訓練樣本和5 000 測試樣本,設置容忍誤差ε=0.05,塊寬?k=3,其余實驗參數設定同比較實驗部分.

圖4 和圖5 分別為基于HPSCNs 的磨礦粒度軟測量模型的收斂特性和逼近特性.由圖4 可以看出,在訓練過程中所提方法具有較好的收斂效果,且在接近容忍誤差前殘差序列能夠快速下降.為了便于觀察,這里僅取500 個測試數據的逼近效果(如圖5 所示),從中可以看出模型輸出與真實值基本吻合,可以實現磨礦粒度的準確估計.

圖4 模型的收斂曲線Fig.4 Convergence curve of HPSCNs

此外,從圖5 可知,所建立磨礦粒度軟測量模型在達到期望精度時,建模時間較快,網絡結構簡單,具有良好的泛化性能;Eff=25.0 %,其中左側點增量網絡(PSCN)、右側塊增量網絡(BSCN)貢獻最佳模型參數的次數分別為3 和9,說明模型具有較高的有效性.需要指出的是,上述礦粒度軟測量模型是通過輸入特性維數較少的樣本建立的,本文所提方法應用到其他數據維數較多的工業案例中,將會取得更好的優勢.同時在多維大數據應用時,還可以考慮并行節點池構建策略,以提高學習速度.

圖5 模型的逼近特性Fig.5 Approximation performance of HPSCNs

4 結語

本文基于隨機配置網絡提出了一種模型與數據混合并行的增量學習方法.實際數據仿真研究表明:與傳統SCNs 和塊增量SCNs 相比,本文所提方法大大降低了計算量,提高了資源利用率,所建立模型綜合性能好,且利于硬件實現,具有良好的實用價值.然而,HPSCNs 直接根據PSCN 和BSCN 的殘差選擇新增節點,在BSCN 獲得殘差優勢不明顯的情況下,選擇了增加節點塊構建模型,不利于模型緊致性.下一步的研究目標是進一步提高算法的綜合性能,如針對HPSCNs 模型的有效性,建立新的模型參數交互準則;在保留塊增量SCNs 極速建模優勢的情況下,削減其中的冗余隱含層節點.