摘要:分析了傳統的鉆井事故診斷與處理專家系統的不足,根據鉆井專家決策時的認知過程,基于實例推理技術開發了井下復雜情況與事故智能診斷和處理系統。該系統收集了各油田已發生的各種復雜的事故實例,具有自學習功能,能實現各種復雜情況與事故的診斷和處理,并提供完整的有關復雜事故預防和處理的知識手冊,可為鉆井專家、技術人員提供決策支持。對系統的總體結構、工作流程以及系統實現的主要技術包括實例表示、實例庫組織、實例檢索和自學習等進行了詳細描述。
關鍵詞:復雜情況與事故; 智能; 診斷和處理; 基于實例推理; 實例檢索
中圖分類號:TP206.3文獻標志碼:A
文章編號:1001-3695(2008)05-1446-04
鉆井是一項隱蔽的地下工程,存在著大量復雜和不確定的因素,采集和獲取的信息往往是不精確的、模糊的、非數值化的,要根據這些信息快速、準確地對井下各種復雜情況與事故進行診斷和處理,傳統的數值分析方法無能為力,必須運用人工智能方法進行智能決策。目前大多數智能診斷與處理系統是基于人工智能中規則推理的專家系統。這類系統將領域專家的經驗知識抽象為if-then形式的規則,利用規則進行推理判斷,其優點是知識表示形式簡單、直觀,推理過程易于形式化。但隨著應用的不斷深入以及問題的規模、復雜度的增加,其固有的缺點暴露出來[1]:a)當規則集的規則數量增多時,規則的一致性及完備性難以檢驗和保證;b)推理效率低下;c)不太符合人類的認知規律,過于強調專家知識的形式化和規則化。事實上,復雜情況與事故的診斷是多樣、復雜和難以確定的,專家知識單靠規則表示難以形式化,因此存在知識獲取瓶頸。
在實際鉆井中,對復雜情況與事故的診斷和處理,有經驗的鉆井專家通常是根據以往類似問題決策的經驗和結果來解決當前所面臨的問題。例如,當遇到新的鉆井事故時,首先會聯想以前處理過的與當前有相似情節的事故實例;然后取其成功或失敗的經驗來解決當前面臨的新事故,由此高效地作出最佳決策。因此實例是專家決策的主要依據。當前人工智能領域新興的一種推理技術——基于實例推理就是一種基于記憶、利用以往求解類似問題的實例或經驗進行推理,從而獲得當前問題求解結果的一種新的推理模式[2]。它符合鉆井專家決策時的認知過程,反映了專家認知過程中根據過去的經驗和方法進行推理求解,從失敗和成功中進行學習的特征。它不是從頭做起,因此可提高復雜問題的求解效率,非常適于求解鉆井工程決策問題。為此,提出利用CBR技術開發井下復雜情況與事故智能診斷和處理系統。
1CBR系統的工作過程
當一個新問題需要解決時,CBR系統的工作流程(圖1)如下:a)問題描述,將新問題按規定的實例表示方法描述成問題實例;b)實例檢索,根據實例檢索策略從實例庫中檢索出與當前問題最相似的舊實例;c)實例修正,如果舊實例和新問題完全匹配,則重用舊實例的解決方案作為新問題的解,否則需根據規則庫中的領域知識及新問題的特點對此解決方案進行修正,得到更適合新問題的解;d)實例學習,將新問題及其解決方案形成新實例,并按學習策略添加到實例庫中,從而實現系統的自學習功能。
2系統的總體結構與工作流程
本系統總體結構如圖2所示,主要由10個功能模塊以及相應的數據庫、實例庫、規則庫、知識庫組成。
其工作流程如下:
a)首先通過人機交互界面利用征兆提取器將所發生的復雜情況或事故征兆信息錄入系統,并存入征兆數據庫。
b)根據征兆信息、基礎數據庫中的鉆井基本參數以及規則庫中診斷規則,利用復雜與事故類型診斷模塊進行推理診斷,診斷出所發生的復雜情況或事故屬何種類型,如為粘吸卡鉆。
c)根據實例庫中現有的復雜情況或事故實例,通過智能決策分析模塊并借助輔助計算模塊對已診斷出的復雜情況或事故類型作進一步決策分析,得出其處理方案、預防措施及專家分析意見等,并將決策分析過程與結果存入動態數據庫,以便以后復診。
d)將分析結果通過結果輸出模塊生成Word文檔,進行打印、預覽或保存;同時將當前發生的復雜情況或事故通過實例學習模塊進行自學習,形成新實例添加至實例庫,以便豐富系統的決策經驗。
e)當需要快速獲得最近已診斷分析過的復雜情況或事故信息時,可通過歷史復雜與事故復診模塊從動態數據庫中直接搜索歷史記錄。
f)通過知識獲取與維護模塊可以不斷添加新的復雜與事故診斷和處理知識、規則及實例,并修改或刪除過時的知識、規則及實例,以增強系統的決策能力及適應能力。
g)利用復雜與事故實例查詢模塊可詳細查詢各油田以往發生的各種復雜情況或事故實例。查詢結果可瀏覽或打印輸出。
h)通過查詢復雜與事故預防、處理指導手冊,可了解各種類型復雜情況與事故的預防、處理知識。
3系統的主要實現技術
3.1實例表示
CBR系統中,專家的知識與經驗是以實例形式表示的。實例是知識表示的一種模式,其實際是專家求解問題的一個具體例子。一個實例通常由問題的特征屬性與解決方案(統稱為屬性)組成。對于井下復雜情況與事故的診斷和處理問題,通過深入分析現有的案例以及專家咨詢,得出表征問題的特征屬性如下:
a)井號、油田名稱、事故發生時鉆深、事故發生時鉆遇地層、事故發生時間。
b)基礎數據包括:套管數據(包含套管名稱、頂部深度、外徑和套管鞋深度)和鉆井液性能參數(包括密度、粘度、切力、濾失量、濾餅、含砂量、pH值等)。
c)事故發生征兆包括[3]事故發生時的工作方式、事故發生前的征兆、事故發生后的征兆。
d)事故發生經過。問題的解決方案包括事故診斷類型、事故預防措施、事故處理方案、專家分析意見[4]。
具體的實例描述如表1~3所示的一個示例。其中事故發生經過、事故預防措施、事故處理方案以及專家分析意見等采用文本方式描述。由于內容較多,表中略。
3.2實例庫組織
實例庫組織是為了更好地應用實例,根據實例的特征和檢索的需要,對實例進行整理和歸類。CBR系統中,通常實例檢索的時間復雜度會隨著實例庫中實例個數的增多而線性增長??紤]到復雜情況與事故的診斷和處理問題復雜,實例繁多,為了提高實例檢索的效率,本系統將所搜集的實例按復雜情況與事故的類型進行分類組織,每一類構成一個較小的子實例庫,并在其中選出一個典型實例,作為對該類實例的索引,所有類的典型實例構成一個典型實例庫。因此,系統中實例庫被組織成兩層結構,第一層為典型實例庫;第二層為被分類的子實例庫。子實例庫的實例采用數據庫技術存放于一系列相互關聯的數據表中,主要的數據表如下:
a)實例主表。它包括實例號、井號、油田名稱、事故發生時鉆深、事故發生時鉆遇地層、事故發生時間、事故發生經過、事故類型、事故預防措施、事故處理方案及專家分析意見。
b)基礎數據表。它包括實例號、套管名稱及其頂部深度、外徑、套管鞋深度;鉆井液密度、粘度、切力、濾失量、濾餅、含砂量和pH值。
c)事故發生征兆表。它包括實例號、事故發生時的工作方式、事故發生前的征兆類型及其征兆值、事故發生后的征兆類型及其征兆值。
以上表之間通過實例號關聯。實例號是實例的惟一標志,它按照復雜情況與事故類型進行編碼。
3.3實例檢索模型設計
實例檢索是系統進行智能決策分析的核心,其過程是:a)先按規定格式描述新問題實例,再根據規則庫中的分類規則進行推理,診斷出當前復雜情況或事故的類型,然后根據該類型從典型實例庫中找到相匹配的典型實例,從而確定新問題所對應的子實例庫;b)由實例檢索引擎按下述檢索模型在子實例庫中進一步檢索,找出與新問題實例最相似的舊實例。實例間的相似性常用實例間共有的特征屬性間的相似度來衡量[5],設子實例庫中的實例集合為CB={C1, C2,…,Ck},新問題實例為C0,它有n個特征屬性A={A1, A2,…,An }。
3.3.1新舊實例各對應屬性間的相似度計算模型
傳統的實例間相似度計算模型一般要求其特征屬性有確定值,但本系統的實例不僅包含有確定性屬性,還包含不精確特征屬性。為此,本系統基于各種類型的屬性,提出一種新的相似度綜合計算模型。
1)確定性數值型屬性之間的相似度計算模型
若檢索結果實例與新問題足夠接近(通常取相似度≥0.98[6]),則直接用檢索結果實例的解決方案作為新問題的解;否則需對此解決方案進行修正,得到更適合新問題的解。修正方法是先比較新問題實例與檢索結果實例的特征屬性之間的差異;然后根據規則庫中的領域知識與經驗以及新問題的特點,對解決方案加以修正以補償那些屬性匹配不一致的地方,從而得到新問題的解。
3.4實例學習
實例學習指系統在診斷過程中能夠不斷地將新問題及其解決方案作為新實例加入到實例庫中,從而豐富系統的診斷經驗,實現系統的自學習功能。當然,并不是每個新實例均有保存下來的價值。新實例產生以后,應對其加以評價篩選,否則實例庫中實例的質量便會降低,同時實例庫的規模會迅速膨脹,從而降低系統的推理效率。為此,本文采用如下策略對其學習行為加以控制:對診斷過程中形成的新實例進行價值分析,即計算它與相應子實例庫中所有舊實例間的相似度sim={sim1,sim2,…,simk}。其中:k為舊實例數;simi (i=1,2,…,k)為新實例與舊實例Ci之間的相似度。當所有simi均小于某一給定的閾值τ(通常取τ=0.8[6])時,認為新實例為高價值實例,加入到實例庫;否則是低價值或無價值的,不予加入。
4系統運行部分示例
系統運行時用戶從圖3所示的界面錄入復雜情況或事故征兆及其可信度值,單擊“診斷”按鈕,系統根據規則庫中的診斷規則進行推理,診斷當前所發生的復雜情況或事故屬何種類型(如泥包卡鉆),通過“結果輸出”按鈕顯示診斷結果,并可進入圖4所示的交互界面進一步決策分析;此時用戶可錄入復雜情況或事故的特征參數,單擊圖4 的“決策分析”按鈕,系統啟動智能決策分析模塊中的實例檢索引擎,并根據實例庫中復雜情況或事故類型的實例,基于CBR技術進行決策分析,得出其處理方案、預防措施以及專家分析處理意見等。從“結果輸出”按鈕可查看其詳細分析報告(報告為Word文件格式)。
運行系統的復雜情況與事故預防、處理指導手冊,可獲得各種復雜情況與事故預防、處理知識,包括復雜情況或事故發生的原因、發生時的特征、預防措施、處理方法以及處理流程等(圖5);運行實例查詢功能,可從實例庫中查詢各油田已發生的復雜或事故實例,查詢結果示例如圖6所示。
5結束語
基于實例推理是對人類形象思維的模擬,適于專家知識難以形式化表達且已積累豐富實例的決策問題領域。本文基于實例推理技術開發的井下復雜情況與事故智能診斷和處理系統克服了傳統專家系統中存在的知識獲取瓶頸問題,且具有自學習、決策效率高等優點。該系統包含了近千個復雜與事故實例,可對井下27類復雜情況與事故進行診斷,并提供其預防措施、處理方案以及專家分析意見等;還提供了完整的有關復雜與事故預防、處理的知識手冊。本系統也是筆者與中國石油長城鉆井公司合作項目的一個子系統,已在海外兩個國家的多個鉆井隊投入了實際應用。
參考文獻:
[1]王東,劉懷亮,徐國華.案例推理在故障診斷系統中的應用[J].計算機工程,2003,29(12):10-12.
[2]張榮梅,徐序彥.基于CBR的交通事故處理智能決策支持系統[J].計算機工程與應用,2002,38(2) : 247- 249.
[3]蔣希文.鉆井事故與復雜問題[M].北京:石油工業出版社,2001.
[4]楊勇,胡書林,陳開聯.鉆井工程事故分析與預報[J].錄井技術,2003,14(2):54-59.
[5]BURKHAND L D. Similarity and distance in case-based reasoning[J]. Fundamental Informatics, 2001,54(17):201-205.
[6]SLONM T Y, SCHNEIDER M. Design issues in fuzzy case-based reasoning[J].Fuzzy Sets and Systems,2001,117(59):251-267.
“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”