劉思陽
(中鐵二院工程集團有限責任公司,四川成都,610031)
CBR是由認知科學衍生而來。1982年,由耶魯大學Roger shank首次提出了CBR理論的理論框架,之后其學生以此為基礎開發出了CTRUS的CBR系統[5][6]。CBR模擬人腦的思維來處理問題,即類比推理。在問題求解的過程中,隨著案例的增加系統的知識和經驗逐漸增加,即增量式學習。并且解決問題時根據經驗可以抓住重點,避免重蹈覆轍[1]。相較于專家系統,CBR還能規避知識獲取的困難,因其知識便是存儲在案例庫中的案例。諸多優勢使得CBR具有很大的研究價值和應用潛力。
鐵路工程在歷史中積累了大量的案例,將這些案例資料結構化地組織起來以供未來使用,既可以提高決策者的決策效率也避免了資源浪費,結合CBR(Case-based reasoning)技術,可以合理地將諸如線路方案比選等工程案例組織起來,通過其4R循環:Retrieve、Reuse、Revise、Retrain的技術路線[4],應用到新的方案決策當中。筆者嘗試對鐵路滑坡構建CBR決策系統,為未來進行不良地質區域選線、鐵路防災減災等鐵路工程領域的決策提供新的思路。
滑坡是鐵路遭遇地質災害的頭號勁敵,尤其在我國山區面積占比如此之大的廣袤地域。滑坡給鐵路線路帶來的危害體現在滑坡體掩埋軌道、列車,帶來人員傷亡,行車中斷以及工程破壞,如鐵西滑坡中斷行車40天。
鐵路選線在進行方案比選時,主要從技術和經濟兩個方面來考慮,其中技術指標又可分為反映工程條件的和反映運營條件的兩類[2]。
為了消除或降低滑坡帶來的危害,進行鐵路選線時應通過判斷滑坡的治理難度和預判滑坡可能造成的破壞程度(即風險性)以及工程的經濟和運營評估,來作出線路是繞避還是整治通過的決策。
根據鐵路選線原則,從技術、經濟、運營和風險四個方面對滑坡區域進行線路方案決策建立指標體系,如圖1所示。其中技術評價指標通過判識滑坡的治理難度來量化,風險評價通過判斷滑坡對線路的破壞程度作出。

圖1 滑坡區域線路方案決策指標體系
滑坡區域鐵路選線,主要是依據技術、經濟、運營等條件作出的,在治理方案技術難度很高或不經濟,以及后期運營的風險較高的情況下,多采取繞避措施。反之,采取治理的短直方案通過。鐵路滑坡的決策流程如圖2所示。

圖2 鐵路滑坡的決策流程
對 CBR決策系統各個模塊的構建方法進行研究后[8],本文總結出 CBR決策系統的技術路線如圖3所示。結合鐵路滑坡的決策流程以及CBR決策的技術路線,構建基于CBR的鐵路滑坡決策系統的框架如圖4所示。

圖3 CBR決策系統的技術路線

圖4 基于CBR的鐵路滑坡決策系統的框架
在專家系統中,知識的表達方式主要有:基于產生式規則、基于框架、基于一階謂詞以及基于語義網絡等。在CBR中,知識即存在于案例中,目前主要的案例表達方式有:記憶網絡、因果關系圖、謂詞邏輯、關系型數據庫、面向對象表示、框架表示以及全文本表示等[1]。
將決策指標數字化后,基于關系型數據庫強大的數據操控能力及接口兼容性,本文采用關系型數據庫來表達案例,案例的特征以數值或符號屬性來量化。在Access中創建的關系表及其關系見圖5所示。

圖5 鐵路滑坡案例關系表及其關系
案例檢索是系統解決問題的第一步,即在案例庫中搜尋到與目標案例相似的源案例。案例的匹配主要是通過計算案例之間的相似度來完成。CBR中主要使用基于距離度量的相似度計算方法,包括基本的方法和擴展的方法。其中基本方法主要有:歐氏距離法和海明威法。而擴展的方法有基于屬性關聯性的算法、基于事例可修改性的度量法等,它們用于更為具體的環境[1]。其中以基于距離的相似度計算法最為常用。

表1 相似性計算模型
根據屬性值的數據類型,分別有不同的模型予以計算。對于幾何模型,假定有和兩個案例,特征分量在取值,在取值。其計算方法見表1所示。
在實際的問題求解中,并非每次的案例匹配都能找到相似度較高的源案例,往往只是找到幾個相似度較高(高于設定的閾值)的案例。此時不能直接照搬源案例的解,而是需要采取某種手段將源案例的解修正到符合目標案例情況的解,然后輸出。
人工神經網絡(ANN)是一種模擬生物神經元的數學模型,它的知識存在于神經元的權重中,當環境(即輸入樣本)發生變化,給出的反饋(即輸出)也將發生變化。ANN的使用前提是大量的訓練樣本,而CBR系統中積累的大量案例恰好滿足這個前提。目前常用的神經網絡模型有BP神經網絡、徑向基(SVM)網絡、Hopffied網絡、Elman網絡等,前兩個屬于前向網絡,后兩者屬于反饋網絡[3]。出于對非線性逼近能力和網絡訓練效率的考慮,本文采用SVM的變種——廣義回歸網絡來進行問題求解。在MATLAB神經網絡工具箱中,有可直接使用的廣義回歸網絡函數。
本文依循如下思路進行決策目標求解:檢索相似案例,以相似案例為樣本訓練神經網絡,驗證神經網絡的正確率,正確率滿足要求的情況下進行目標案例求解。
目標案例為銀西鐵路線路設計時在驛馬滑坡中的方案選擇問題,滑坡位于甘肅隴東慶陽,

表2 目標案例特征要素
驛馬滑坡位于甘肅省慶陽市驛馬鎮東側,滑坡發育于驛馬溝左岸與支溝相交處,滑坡的特征如表2所示[7]。擬選線路方案從滑坡后緣通過,決策目標是通過技術、經濟、運營、風險四個指標,給出繞避或是治理通過的優選方案。
目標案例的特征數值化并離散化為符號數值見表3。其中分別指:巖石硬度、巖體結構、風化程度、巖體組合、巖層構造、巖體厚度、坡體坡度、坡體高差、坡體坡形、年降雨量、地震烈度、人類活動、植被覆蓋率。分別指工程破壞程度和滑坡治理難度。

表3 目標案例屬性量化值

圖6 案例篩選結果
由于目標案例的決策時間是2016年3月,因此首先在案例數據庫中提取出16年3月以前的案例,見圖6所示,將提取出的案例進行數據處理見圖7所示。
運用2.3中所述的符號屬性相似度計算方法,計算出目標案例與各源案例的相似度見表4所示。以0.6為閾值,選出相似度較高的案例,有:案例1、案例21、案例35、案例36。

圖7 數據處理

表4 相似度計算結果
3.2.1 計算決策指標
根據3.2中選出相似案例與目標案例的相似度,計算出用于預測目標案例決策指標的權重見表5。然后由4個相似案例相應的決策屬性值結合權重計算出目標案例的決策指標見表6所示。

表5 決策權重

表6 目標案例決策指標值
3.2.2 最終方案決策

表7 設計階段的案例決策表

從案例數據庫中選擇處于設計階段的鐵路滑坡選線案例,并進行數據處理見表7所示。其中代表四個條件指標滑坡治理難度,工程破壞程度,工程經濟評價,工程運營評價,即分別指代方案的技術指標、風險指標、經濟指標以及運營指標。是指最終決策,0為繞避,1為治理通過。
通過選出的17條設計階段的選線案例,以前12個為訓練案例集使用廣義回歸網絡進行訓練,后 5個為測試集,測試網絡的正確率。網絡訓練用時0.023130s,網絡測試正確率為100%,得到的決策結果是0,即繞避,與實際的方案比選結果一致。
本文嘗試將CBR技術運用到滑坡區域鐵路選線,在鐵路滑坡CBR決策系統的構建中,對案例表達、案例檢索、案例重用進行了相應的研究,其中利用關系型數據庫進行案例表達,具有較強的可操作性,利用人工神經網絡進行案例重用,并結合實際案例檢驗,是可行的。
未來還需進一步對應用到鐵路工程的CBR決策系統進行研究,在案例重用模塊和案例維護模塊可進行規則庫的構建,以達到更有深度的決策要求。以及將案例數據庫擴展到整個鐵路災害領域,以求提高系統應用的廣度。
[1]李鋒剛.基于案例推理的智能決策技術[M].合肥: 安徽大學出版社,2010.
[2]易思蓉.鐵路選線設計[M].成都: 西南交通大學出版社, 2009.
[3]陳明等.MATLAB神經網絡原理與實例精解[M].北京: 清華大學出版社, 2013.
[4]郭艷紅, 鄧貴仕.基于事例的推理(CBR)研究綜述[J].計算機工程與應用, 2004, 40(21): 1-5.
[5]Kolodner JL.Improving human decision making through case-based reasoning techniques[J].AI Magazine, 1991, 12(3): 52-59.
[6]TR Hinrichs, JL Kolodner.The roles of adaptation in case-based design[C].In:Proceedings of Case-based Reasoning Workshoop, Washington, 1991:121-132.
[7]周福軍.銀西鐵路驛馬黃土滑坡工程特性與變形研[J].鐵道標準設計,2016, 60(8): 30-35.
[8]劉思陽.鐵路滑坡 CBR決策系統的構建研究[D].成都: 西南交通大學,2017.