王敬,王全鳳
(1.中冶建筑研究總院有限公司,北京 100088;2.華僑大學土木工程學院,福建 泉州 362021)
復雜系統風險分析的模擬方法
王敬1,王全鳳2
(1.中冶建筑研究總院有限公司,北京 100088;2.華僑大學土木工程學院,福建 泉州 362021)
采用粗糙集理論進行知識約簡并選擇主要風險因素,應用神經網絡理論方法尋找主要風險因素與總體風險之間的模糊關系模型.最后,采用蒙特卡羅方法模擬系統總體風險的概率分布,形成復雜系統風險分析的集成模擬方法.通過水利生態系統實例驗證,證明該方法是合理且可行的.
知識約簡;粗糙集;風險分析;神經網絡;蒙特卡羅仿真
對復雜系統的風險分析,主要是解決以下3個方面的問題:(1)風險因素的辨識及主要風險因素的確定;(2)如何根據主要風險因素的水平來表達系統整體風險的水平,即整體風險的評估;(3)如何尋找系統風險的概率分布,對風險的重要性作出判斷.近年來,我國已經實施或者正在規劃一系列流域生態環境恢復水資源保障計劃.對水利生態系統分析的目標,就是尋求系統的最優發展路徑.這個目標具有一定的模糊性和不確定性,無法用簡單的函數表達.水利生態系統初始狀態向目標狀態轉移的路徑集合中,各條路徑成為最優路徑概率不同,因此需要將不同路徑的風險水平引入系統可持續發展測度的計算中.即將研究目標轉化為評估系統不同發展路徑的風險水平,并以此進行水利生態系統的可持續狀態分析.本文通過近代數學方法,對水利生態復雜多樣的系統進行風險分析.
粗糙集是一種處理不精確、不確定與不完全數據的新的數學理論[1-5].知識約簡是粗糙集理論的核心內容之一.通過知識簡約可以在復雜、繁多、變化的知識庫中進行知識挖掘,尋找并確定解決問題所需的充分必要的條件(因素),為解決問題提供基礎依據.文中所研究的問題為完備信息系統,因此,只討論完備信息系統的知識約簡問題.
1.1 完備信息系統的知識約簡[2]
定義1 設S=(U,A,F)是一個信息系統,其中U為對象集,A為屬性集,A={a1,a2,…,am},F為U與A之間的關系集,即F={fl∶U→Vl},其中Vl為al(l≤m)的值域.
定義2 設S=(U,A,F),至少存在一個α∈A T,使得Vl含有空值,則稱知識表達系統S為不完備信息系統;否則,稱S為完備信息系統.
對于完備信息系統,通過建立區分矩陣來計算區分函數,由區分函數的值確定信息系統的約簡與核,從而實現信息系統的知識約簡.
(1)區分矩陣與區分函數.
定義3 設S=(U,A,F),則區分矩陣是一個n×n的對稱矩陣,矩陣中的任意元素為

定義4對每一個屬性a指定一個布爾變量α,若α(x,y)={α1,α2,…,αk}≠Φ,則令α(x,y)=1.區分函數可定義為

(2)約簡與核.區分函數Δ的極小析取范式中,所有合取式是屬性集A的所有約簡.核是區分矩陣中所有單個元素組成的集合,即

定理1 定義red(A)為A的所有約簡,由此可得核與約簡的關系為
core(A)=∩red(A).
1.2 知識約簡步驟
在整個模型的運行過程中,存在著以下不同環節的風險.這些環節包括[6]:(1)制度設計與執行環節;(2)水利-生態系統供需水量優化配置環節;(3)社會-生態-經濟績效及發展狀態分析環節.
這些環節涉及自然、社會、經濟、工程、管理等多種因素,匯集所有的風險因素,就構成了水利生態系統的風險因素集.這些因素主要包括以下16項:(1)可調用水量,包括來水的不確定性因素;(2)水利生態工程對徑流的控制能力;(3)水庫對生態供水的調控能力;(4)水土流失風險;(5)法律、法規風險因素;(6)生態系統需水量;(7)水利生態績效分析方法的科學性;(8)生態用水價格變化;(9)各相關部門的協調管理風險因素;(10)水利生態系統運行所需資金的籌措和使用風險;(11)社會道德風險.(12)人口總量及增幅對生態系統的消耗;(13)牲畜總量及增幅對生態系統的消耗;(14)生態水權的定位和執行風險;(15)生態系統服務功能價值計算體系的完善程度;(16)跨流域調水量,即對于使用跨流域調水量需要考慮跨流域調入水量存在的風險.
對于不同的水利生態系統,以上風險因素根據具體情況有所不同,應該按照實際情況考慮.文中的案例沒有跨流域調水量,因此,去掉需要考慮跨流域調入水量存在的風險,則確定該水利生態系統的風險由其余的15個評價指標構成.即A={a1,a2,…,a15}.按照風險因素對系統目標的影響程度,取風險評語集為V={很大,大,中,小},并按照上述理論進行知識約簡.
按照該水利生態系統的具體情況,根據不同的來水頻率(η)、調水方案(A:水源獨立供水;B:水源獨立供水;A+B:水源聯合調度)、生態補水路線(3條)、生態水權狀態、生態需水量(V)大小等,可形成多種運行方案.選取其中9個方案進行分析,U={x1,x2,…,x9},如表1所示.

表1 方案簡表Tab.1 Projects
通過專家調查、打分,獲得各個方案風險因素的評語集,如表2所示.為說明問題及節省篇幅,以下取x1,x2,x3方案進行詳細分析.

表2 方案與風險因素關系表Tab.2 Relationship between project and risk factor
(1)依據給定的關系表,計算區分矩陣中各元素的值,列出區分矩陣為

由區分矩陣,計算區分函數,有

(2)根據區分函數的值,找出信息系統的所有約簡為{a1},{a6},{a9},{a10},{a11},{a14},{a15}.
(3)從信息系統所有約簡中,按照找出信息系統的核.由于從所有信息系統的約簡中找不出核,所以約簡后信息系統的屬性取為a1,a6,a9,a10,a11,a14,a15.
(4)根據定義,按照核或約簡中包含的元素,列出約簡后的關系表(限于篇幅,略去).
通過9個方案約簡后,最終屬性集合變為A={a1,a6,a9,a10,a11,a14},即該屬性集合中的元素是主要風險因素.
主要風險因素確定后,即可建立其與整體風險水平的關系.采用風險效用來表示系統的整體風險[7].風險效用是指對主要風險因素所導致系統可能偏離目標程度的判斷.如果用U表示風險效用,用Z=(z1,z2,…,zn)表示主要風險因素,則兩者之間的關系為

一般情況下,由于項目的復雜性,以及各種因素的相互作用等影響,主要風險因素與項目總體風險之間并不能直接用數學表達式(函數式)表達,即f一般無法得到具體的關系.為了形成一種具有普遍意義的方法,采用神經網絡方法建立主要風險因素與風險效用之間的關系.
2.1 主要風險因素標準化與概率分析
2.1.1 主要風險因素量化 因素屬性分為效益型、成本型等多種類型.類型不同,對屬性值的要求也不相同.為了更好地進行神經網絡訓練與模擬,對涉及的兩種主要風險因素進行標準化分析.
(1)效益型.其量化值計算方法為

(2)成本型.其量化值計算方法為

上兩式中:Zj,aj分別為風險因素的第j個量化標準值和評估值,n為方案數量;bj=max(aj)或bj=,而為因素的理想點.
2.1.2 主要風險因素的概率分析 確定風險事件的概率分布通常有3種方法[6],即根據歷史資料確定風險事件的概率分布、利用理論概率分布和主觀概率法.對于具有長系列資料的因素,通過分析,可直接選用概率統計中的概率分布進行風險估計.當沒有足夠的資料來確定風險事件概率分布時,可利用理論概率分布或主觀估計的方法對其進行估計.
水資源風險估計中常用的概率分布有正態分布、對數分布、皮爾遜Ⅲ型分布等.在獲得的信息不夠充分的條件下,需要根據主觀判斷和近似的方法來確定概率分布.由于水利生態實踐的時間較短,對風險因素概率的分布研究缺乏足夠的統計資料和數據分析成果,因此可以采用推斷、主觀判斷和理論概率分布等方法表達各因素的概率分布.文中風險因素的概率分布主要采用[0,1]均勻分布,如z1,z2,z3,z4,z5,以及[0,1]區間內分段取定值分布,如z6.
2.2 效用-風險因素關系神經網絡模擬模型
2.2.1 風險模擬的神經網絡結構[8]選擇基本的BP網絡作為解決實際問題的工具,通過對訓練樣本的學習、誤差反饋、逐漸逼近并形成模型,其結構關系是通過組織輸入層與隱含層、隱含層與輸出層間的連接關系來實現的.輸入層中,神經元個數與主要風險因素個數n相同;輸出層中,風險效用U即輸出層的神經元個數為1;隱含層神經元的個數尚無統一的確定方法,視具體情況由訓練過程確定.
2.2.2 網絡學習樣本的確定及網絡訓練
(1)學習樣本的輸入.經過知識約簡后,取可調用水量,生態系統需水量、各相關部門的協調能力、水利生態建設、運行所需資金的籌措和使用風險、社會道德風險生態水權等6個為主要風險因素.將其作為輸入向量,經過排序、量化、歸一化后,結果如表3所示.

表3 風險因素相對數值Tab.3 Relative values of risk factor
(2)學習樣本的輸出.根據上述9個方案的主要風險因素的取值,采用專家調查方法,可分別獲得9個方案x1~x9的風險效用U:0.305 3,0.523 5,0.911 2,0.813 4,0.751 1,0.755 6,0.278 9,0.356 7,0.400 1.
(3)神經網絡收斂結果.以表3及風險效用值為樣本,采用Matlab程序庫中函數訓練的BP網絡模型,建立輸入層為6個單元,隱含層為2個單元,輸出層為1個單元的BP神經網絡模型.神經網絡訓練收斂過程,如圖1所示.圖1中:T為精度值;n為循環次數.

圖1 神經網絡訓練收斂過程Fig.1 Convergence process of training of neural network
2.3 基于蒙特卡羅模型的風險概率模擬
水利生態可持續發展方案風險分析是多因素多目標風險問題,直接由各主要風險因素的概率分布組合求出風險目標的理論概率分布很困難.這是因為確定各主要風險因素的理論概率分布存在困難;而且對于多因素的聯合概率分布的確定就更困難.鑒于此,采用蒙特卡羅模擬技術[9]進行風險目標的概率分布分析.
設效用與主要風險因素之間函數關系如式(4),按照主要風險因素的概率分布,抽取一組隨機變量(z1,z2,…,zn)的值,按照訓練完成的神經網絡模型確定U的值.反復獨立抽樣(模擬)多次,便可得到函數的一批抽樣數據.當模擬次數滿足預定的精度要求時,便可給出與實際情況相近的函數U的概率分布及其數字特征,即完成了系統的風險估計.模擬得到的水利生態系統的風險概率分布圖,如圖2所示.
2.4 系統風險評價
在風險估計的基礎上,通過系統風險效用值及系統風險的概率分布對系統的風險狀態進行綜合分析,可以得到不同方案水利生態系統的風險水平.風險水平可定義為

對于給定的方案i,其風險效用值為Ui(由神經網絡模型得到),頻率為Pi(由圖2給出),則該方案的風險水平為Vi.Vi反映了風險的相對嚴重性.Vi越小說明系統的風險水平越低,系統越可靠;反之亦然.有時風險的效用值Ui很大,但由于出現的概率較低,風險水平并不高;而有時效用值Ui并不大,但由于出現的概率較高,風險水平并不低,系統的可靠性不高.
對于上述案例,通過模擬可得到不同方案風險的相對排序為
V2>V9>V8>V1>V6>V5>V7>V4>V3.
說明,方案3的風險水平最低,而方案2的風險水平最高.

圖2 水利生態系統的風險概率分布圖Fig.2 Distribution of risk probability for water conservancy ecosystem
復雜系統一般都具有多屬性、空間尺度和時間延伸性共同作用,以及在系統運行過程中多環節、多主體的特點,導致對這種系統的風險評價十分復雜.文中以水利生態系統風險分析為例,通過粗糙集理論、神經網絡和蒙特卡羅等方法的集成,形成一種基于知識簡約、神經網絡模型和蒙特卡羅模擬的復雜系統的風險分析方法.水利生態系統風險分析的驗證結果表明,通過不同方案風險水平的計算,可直觀地比較不同方案的風險影響程度,為復雜系統的風險分析提供一種新方法.
[1]MI Ju-sheng,WU Wei-zhi,ZHANG Wen-xiu.Approaches to knowledge reduction based on variable precision rough set model[J].Information Sciences,2004,159(3/4):255-272
[2]張文修,仇國芳.基于粗糙集的不確定決策[M].北京:清華大學出版社,2005.
[3]YAHIA M E,MAHMOD R,SULAIMAN N.Rough neural expert systems[J].Expert Systems with Applications,2000,18(2):87-99.
[4]張文修,吳偉志,梁吉業,等.粗糙集理論與方法北京[M].北京:科學出版社,2001.
[5]方千山.粗糙集理論在模糊隸屬函數辨識中的應用[J].華僑大學學報:自然科學版,2003,24(1):33-38.
[6]王敬.水利生態系統可持續發展研究[D].北京:華北電力大學,2007.
[7]沈建明.項目風險管理[M].北京:機械工業出版社,2003.
[8]樓順天,施陽.基于MATLAB的系統分析與設計:神經網絡[M].西安:西安電子科技大學出版社,1999.
[9]LIU J S.科學計算中的蒙特卡羅策略(英文影印版)[M].北京:世界圖書出版社,2005.
Simulation Method for Risk Analysis in Complex System
WANG Jing1,WANG Quan-feng2
(1.Central Research Institute of Building and Construction CO.L TD.MCC Group,Beijing 100088,China;2.College of Civil Engineering,Huaqiao University,Quanzhou 362021,China)
The rough set theory(RST)is used as knowledge reduction and the selection of main risk factors.The fuzzy relationship model between main risk factors and overall risk is established by artificial neural network(ANN).The probability distribution of overall system risk is simulated by Monte Carlo method,an integrated simulation method is proposed for complex system risk analysis.The method is reasonable and feasible by verification of water conservancy ecosystem.
knowledge reduction;rough set;risk analysis;artificial neural network;Monte Carlo simulation
TV 213.4;TP 18
A
1000-5013(2010)03-0337-05
(責任編輯:黃仲一 英文審校:方德平)
2009-05-05
王全鳳(1945-),男,教授,主要從事土木工程的研究.E-mail:qfwang@hqu.edu.cn.
水利部水利生態績效審計評價基金資助項目(040310)