梁世翔,劉 杰,沈衛文
(1.武漢理工大學ITS中心,武漢430063;2.武漢交通職業學院,武漢430062)
航行中的船舶在面臨碰撞風險時,如何選擇避碰行為,減少碰撞風險和損失是船舶駕駛員要考慮的首要問題[1]。避讓行為的選擇涉及到船舶駕駛員的心理、經驗、避讓規則制度和外界環境等多種不確定因素的影響,是一種不確定推理。利用證據理論建立貨運船舶的避碰模型,能對碰撞行為進行風險評價,為船舶駕駛員選擇避碰行為提供決策依據。
D-S證據理論是由丹普斯特(Dempster)在1967年最初提出,并由他的學生莎弗(Shafer)在1976年改進并推廣形成的一種不確定推理模型。該理論引入可信度函數來量度不確定性,引用似然函數來處理由不知道而引起的不確定性。
為了描述假設的不確定性,D-S證據理論首先引入關于可信度分配函數的概念。設論域Θ為所有可能假設(表示為原子命題的結論)的有限集合,且Θ中的元素間是互斥的,則可以在Θ的冪集2Θ上定義一個可信度分配函數(基本概率分配函數)m∶→[0,1],滿足
其中:A稱為焦元;m(A)數值稱為基本概率分配函數(基本可信度分配),它表示依據當前環境(證據)對假設集A(Θ的了集)的信任程度[2-4]。
設Bel1和Bel2是同一識別框架Θ上的兩個可信度函數,m1、m2分別是其對應的基本可信度分配,焦元分別為A1,A2,…,Ak和B1,B2…,B1,設
定義函數m:2Θ→[0,1]是可信度分配,則:
用式(1)求m1,m2直和的方法稱為Dempster合成法則。
應當指出的是,多個證據的融合可由兩個證據融合后經遞推后得到,因此,在實際求解時,為降低計算的復雜程度,常常通過遞推來進行多個證據的合成[5-6]。
設決策系統的狀態集為S={x1,x2,…,xq},決策集為V={v1,v2,…,vp},報酬函數為:
選取目標為:
若v*∈V,使Ar(v*),則V*即為最優決策。
當r(vi,xj)失去損失意義時,可先將r(vi,xj)取負值,再利用上述規則計算。
在船員的避碰知識結構中,避讓行動的確定是與決策者的人為因素關系最密切的知識,因人而異,且隨會遇局面的不同而不同,沒有一個固定的模式。在研究智能避碰專家系統的過程中,必須用定量的方法來研究采取的避碰行動,綜合起來,避碰措施可分為以下10種。
1)保向保速;
2)符合大幅度原則的右轉;
3)向右轉向與他船平行;
4)向右轉向把他船置于船尾;
5)大角度向左轉向;
6)向左轉向與他船平行;
7)向左轉向把他船置于船尾;
8)減速;
9)停車;
10)緊急倒車。
在上述行動當中,常規行動有三種:大幅度轉向,減速和保向保速。其余為應急行動。由于避碰行為具有不確定性,可利用證據理論和M決策法來優選避碰方案。
影響選擇避碰方案的關鍵指標是代表其碰撞風險度的多項指標,包括避讓行為的損失、對風險的反應時間及碰撞風險。在方案的核心碰撞風險指標識別出來后,可依據下列條件來選擇避讓行為。e(i),(i=1,2,…,n)表示知識庫中尚有i個候選方案作為目標方案入圍,則滿足下列條件的避讓行為即為我們所選的避讓行為。
1)避讓損失C最小。避讓損失C主要包括因避讓行為失敗所帶來的損失;
2)駕駛員對碰撞風險的反應時間。船舶駕駛員為更快地把握快速變化的碰撞風險,要求駕駛員對所采取的避讓行為下對碰撞風險的反應時間T最短。
3)碰撞風險測度R最小。船舶碰撞風險測度定義為避讓行為的碰撞風險因子的期望值與其可能出現的概率的矩陣。
2.2.1 避讓行為狀態描述
設一貨運船舶在航行中面臨碰撞風險,駕駛員為防與目標船發生碰撞,選擇避讓行為。避讓行為集為V={vj}(i=1,2,…,n),其模糊集分別為高、中、低,其對應的取值因人而異。船舶駕駛員面臨碰撞風險時采取常規避讓行為為大幅度轉向、減速和保向保速,分別記為V1,V2,V3,每一種避讓行為失敗所帶來的風險損失不同,避讓行為對碰撞的反就時間及避讓行為所帶來的碰撞風險不同,而且因駕駛員對風險的認識不同取不同的值。設各候選行為的風險成本、對風險的反應時間和碰撞風險測度經測算,分別見表1、2、3。要從上述3個候選行為中,選擇最佳的行為作為本船舶所應采取的避讓行為。這一決策過程可由證據理論通過證據融合后給出。
表1 候選行為的風險成本
表2 候選行為的碰撞反應時間
表3 候選行為所帶來的碰撞風險測度
2.2.2 避讓行為選擇
這實際上是一個多目標優化決策的問題,根據信息融合中的證據理論求解如下。
1)單目標決策。根據M決策法,分別對候選行為的風險成本、反應時間、風險測度進行單目標決策,Er(vi)(i=1,2,3)。求出 Ar(vi)后,將Ar(vi) i=(1,2,3)進行歸一化,把得到的A′r(vi)(i=1,2,3)當作框架上的基本可信度分配mj(vi)(i=1,2,3;j=1,2,3)。
2)證據合成。運用Dempster-Shafer合成法則,對求得的進行mj(vi)(i=1,2,3;j=1,2,3)合成,得到m(vi)(i=1,2,3),于是就可以根據 Max{m(vi)(i=1,2,3)}決定船舶駕駛員的避讓行為。
3)選擇避讓行為。根據M決策法的思想,分別將表1、2、3進行適當變換,具體就是將表中各項分別取倒數,得到表4、5、6,這樣就符合關于報酬值的含義了。
表4 候選行為的風險成本取倒數
表5 候選行為反應時間取倒數
表6 候選行為風險測度取倒數
由此可見,該問題的識別框架即狀態集合S為{(x1,x2,x3);(y1,y2,y3);(z1,z2,z3)}
經過計算可求得在識別框架上的基本可分配度見表7。
表7 基本可信度分配
根據D-S合成法則,可分別求得三個行為的可信度如下:
根據合成結果,可以得出如下結論:雖然避讓行為v3的風險反應慢,但碰撞風險成本低,而且碰撞風險也最小,可作為船舶駕駛員的最佳的避讓行為。
利用證據理論輔助選擇船舶的避讓行為具有廣泛的應用前景,當需要考慮的參數很多時,由于計算量很大,需要選取合適的算法和可信度分配,有助于提高避讓行為選擇的可信度。
[1]程細得,劉祖源.船舶智能避碰專家系統研究[J].武漢理工大學學報:交通工程版,2003,1:93-94.
[2]高 濟,朱淼良,何欽銘.人工智能基礎[M].北京:高等教育出版社,2002.
[3]蔡自興,徐光祐.人工智能及其應用[M].北京:清華大學出版社,1996.
[4]尹朝慶,尹 皓.人工智能與專家系統[M].北京:中國水利水電出版社,2001.
[5]安居白.智能信息處理[M].大連:大連海事大學出版社,2000.
[6]ALP WINCKLE D S,BROOKING M A,HART D K.OPA 901IMO Legislation and the Ship Emergency Response Service[S].Lloyd's Register of Shipping,1995.