一、引言
人工神經網絡是在非線性經濟預測領域應用較為廣泛的一種方法。它是模擬人的大腦的一種非線性映射,不僅具有很強的容錯性,而且能夠從大量的歷史數據中進行學習,從而揭示大量復雜數據中隱含的重要信息。神經網絡方法已經在很多領域得到了成功的應用,在煤炭行業,煤炭生產成本預測、煤炭需求量的預測、煤炭企業可持續發展的評價、煤炭建設項目投資估算、煤炭成漿濃度預測、煤炭調運的優化等很多方面都有神經網絡模型成功應用的案例。但是,在實際應用中由于缺乏問題的先驗知識,往往很難找到理想的網絡結構,這就影響了神經網絡的泛化能力。神經網絡的泛化能力是指學習后的神經網絡對測試樣本做出正確反應的能力,神經網絡是否成功不在于對訓練樣本本身擬合誤差的大小,而關鍵在于其泛化效果。本文探討了神經網絡集成的框架模型,并對煤炭企業的可持續發展評價進行了實證研究,以期在提高神經網絡泛化能力的同時讓這種技術更加有效地應用于煤炭領域。
二、神經網絡集成
1990年,Hansen和Salamon開創性地提出了神經網絡集成,為解決神經網絡泛化能力提高的問題提供了一個簡易可行的方法。使用這種方法,可以簡單地通過訓練多個神經網絡并將其結果進行合成顯著地提高學習系統的泛化能力。1996年,Sollich和Krogh為神經網絡集成下了一個定義,即“神經網絡集成是用有限個神經網絡對同一個問題進行學習,集成在某輸入實例下的輸出由構成集成的各神經網絡在該實例下的輸出共同決定”。目前這個定義已被廣泛接受。
1 神經網絡集成個體生成方法
在生成集成個體網絡方面,目前最重要的技術是Boosting和Bagging。這兩種技術本身并非專為神經網絡集成設計,可用于多種學習模型。
Boosting是一大類算法的總稱,通過這種方法可以產生一系列神經網絡,各網絡的訓練集決定于在其之前產生的網絡的表現,被已有網絡錯誤判斷的實例將以較大的概率出現在新網絡的訓練集中。這樣,新網絡將能夠很好地處理對已有網絡來說很困難的實例。另一方面,雖然Boosting方法能夠增強神經網絡集成的泛化能力,但是同時也有可能使集成過分偏向于某幾個特別困難的實例。因此,該方法不太穩定,有時能起到很好的作用,有時卻沒有效果。
Bagging的基礎是可重復取樣。在該方法中,各神經網絡的訓練集由從原始訓練集中隨機選取若干實例組成,訓練實例允許重復選取。這樣,原始訓練集中某些實例可能在新的訓練集中出現多次,而另外一些實例則可能一次也不出現。Bagging方法通過重新選取訓練集增加了神經網絡集成的差異度,從而提高了泛化能力。
2 神經網絡集成結論生成方法
當神經網絡集成用于分類器時,集成的輸出通常由個體網絡的輸出投票產生。通常采用絕對多數投票法(某分類成為最終結果當且僅當有超過半數的神經網絡輸出結果為該分類)或相對多數投票法(某分類成為最終結果當且僅當輸出結果為該分類的神經網絡的數目最多)。理論分析和大量試驗表明,后者優于前者。因此,在對分類器進行集成時,目前大多采用相對多數投票法。
三、神經網絡集成的框架模型
為了增強神經網絡模型的泛化能力,筆者使用了如下圖所示的神經網絡集成框架模型,模型使用了對訓練樣本利用得比較充分的Bagging技術來產生個體神經網絡,即通過Bagging從初始訓練集中隨機抽取出多個規模相同的訓練集,然后為每一個訓練集訓練出一個神經網絡個體,再結合具體應用實際使用相應的結論生成方法將上述多個神經網絡的輸出進行合成從而得到最初問題的結論。

四、用于煤炭企業可待續發展評價
煤炭資源屬不可再生資源,煤炭開采必然受到礦區剩余儲量的制約,煤炭企業遲早要面臨資源衰竭。因而,煤炭企業的可持續發展問題日益突出,國內外學術界和決策部門為此進行了大量的探索,特別是在煤炭企業可持續發展水平評價上,開展了不少的研究。應用神經網絡集成模型對煤炭企業可持續發展水平進行評價,可以避免復雜的數學推導,在樣本缺損和參數漂移的情況下,仍能保證得到穩定的結果,同時,也有效回避經典的可持續發展評價方法(如層次分析法、模糊數學和主成分分析法等)無法回避的經驗知識以及決策者個人主觀意向所起的作用,集成學習的方法也保證了模型的泛化能力,這對解決煤炭企業全局性的決策規劃是大有裨益的。
實際操作中,可以先按照煤炭企業可持續發展的涵義和指標體系設計的原則結合已有的研究成果構建評價指標體系;然后根據所評價的問題,結合具體的神經網絡算法建立煤炭企業可持續發展神經網絡評價模型;接下來對訓練樣本采用Bagging方法進行處理,然后為每個訓練樣本訓練出一個神經網絡模型,對這些訓練好的神經網絡模型的輸出采用相應的結論生成方法進行合并,最后得到模型輸出的最終評價結果。
1 煤炭企業可持續發展評價指標體系
對于煤炭企業可持續發展評價指標體系的建立,目前有不少科研機構和學者進行了大量的研究,但煤炭企業可持續發展的度量和評估還未達成共識,還需有較大的改善。但作為煤炭企業,在研究其可持續發展時,應該包括生態持續、經濟持續和社會持續等方面內容,并從煤炭企業的實際需要和可能出發,我們把煤炭企業可持續發展評價指標體系劃分為三個層次,即目標層、準則層和指標層,如表1所示。

經過訓練學習,評價網絡可以輸出衡量可持續發展水平的評價值O,為明確煤炭企業可持續發展水平,設可持續發展狀態分為四級:一級為可持續發展;二級為初級可持續發展;三級為由傳統發展向可持續發展過渡,四級為傳統發展。
2 煤炭企業可持續發展評價神經網絡集成模型
(1)神經網絡評價模型的建立
設可持續發展評價時采用的指標集合為I,評價企業的非空有限集合為U,Iu,表示評價企業u在指標集I上的取值,Ou表示評價企業u對應的可持續發展評價結果,則Ou是在一定的可持續發展評價準則下獲得的,即:
Ou=EVA(Iu)
對所有的評價企業而言,上式可以表達為:
O=EVA(I)
由上式構造BP神經網絡模型,以I為輸入向量,O為輸出向量,即為I→O映射模型。本文中設置神經網絡的輸出神經元個數為2,分別以[0,0]、[0,1]、[1,0]、[1 11]代表企業可持續發展的四級狀態。通過大量煤炭企業可持續發展評價的實例數據的收集,用樣本(I,O)對其進行訓練,BP神經網絡即可學習煤炭企業可持續發展的評價準則,在給定的誤差要求下,當網絡學習完成后,仟意給定煤炭企業可持續發展評價的指標值向量I,神經網絡評價模型將給出其可持續發展結論O,從而完成對煤炭企業可持續發展的評價。
(2)神經網絡評價模型的訓練
本文將所獲得的煤炭企業可持續發展評價的數據按訓練數據集和測試數據集分為兩部分,應用Matlab 7中神經網絡工具箱提供的函數對建立的訓練數據集進行訓練,I和O分別表示訓練數據集的輸入和輸出,測試數據集的輸入和輸出分別為I′和O′,網絡訓練完成后,將I′輸入該網絡,Ol為模型識別后的輸出結果。設定訓練終止次數為100次,訓練終止誤差為10-2,訓練函數為TRAINLM,經反復試驗網絡在隱層神經元個數為26個、經68次訓練達到誤差要求。然后將O+與O′進行比較,選取均方差MSE、隱層結點數Nh總評價錯誤率做為檢驗模型的指標。表2所示為訓練完成的神經網絡評價模型N的檢驗指標。

(3)神經網絡集成評價模型
在神經網絡集成識別模型中,個體神經網絡的輸入、輸出向量的維數相同,結論合成方法采用相對多數投票法。先生成10個BP網絡作為神經網絡集成的個體網絡,這些網絡的輸出神經元分別表示可持續發展評價的結論。通過Matlab對神經網絡集成識別模型進行仿真,神經網絡集成評價模型的檢驗指標如表3所示。

按圖1的流程利用訓練好的神經網絡集成對測試集進行識別,總評價錯誤率為9.2%,這個指標遠遠優于表2中的單一神經網絡。實證研究的結果表明神經網絡集成學習的評價模型可以在很大程度上提高神經網絡模型的泛化能力。
五、結束語
神經網絡集成簡單地通過訓練多個神經網絡并將其結果進行集成,顯著地提高神經網絡系統的泛化能力。本文提出的基于神經網絡集成的框架模型具有以下優勢:(1)神經網絡集成基于神經網絡解決了非線性和時變性問題;(2)神經網絡集成方法比單神經網絡具有更強的泛化能力,預測也更為可靠。為神經網絡在煤炭企業可持續發展評價方面的應用提供了更加有效的手段。