肖尚勤 何 剛 黃金鋒 馮 濤
1 中國艦船研究設計中心,湖北 武漢 430064 2 南京大學 軟件學院,江蘇 南京 210046
船舶工業是為國防建設、航運交通和海洋開發提供主要裝備的戰略性產業,是保障國家安全、發展國民經濟和維護海洋權益的重要工業基礎。加快發展船舶工業,對于加強國防現代化建設、加快海洋開發、振興裝備制造業、促進相關產業發展、擴大船舶出口等具有重要的戰略意義[1-2]。
我國船舶工業經過五十多年的發展,經歷了以軍為主到軍民結合的發展歷程,走過了一條從小到大的成長之路。特別是改革開放以來,經過三十年來的不懈努力,我國船舶工業得到了快速的發展,造船效率明顯提高、造船成本明顯下降,根據國際造船業的發展趨勢,我國船舶工業要實現發展成為世界第一造船大國、強國的跨越式發展目標,必須加快造船企業的信息化建設步伐,建立數字化設計、制造、管理及配套等完整的數字化造船體系,全面實現數字化造船[3]。
艦船設計是一個多專業、多系統、大規模的協同工作過程,周期長,流程復雜。設計人員必須在分布式環境下協同工作,利用數據的并發處理和控制功能及時獲取同步的產品數據信息,協調設計過程中的各種關系,對設計過程實施并行、動態、實時控制[4]。目前,這些工作均由技術人員根據豐富經驗,結合歷史數據完成,存在著勞動強度大,精度不高等缺陷。通過建立知識庫輔助艦船設計,根據總體指標自動對發生沖突的各分項指標進行權衡和優化,將分析所得到的知識集成到業務信息系統的組織結構中可以大幅提高設計質量,減少設計差錯,提高研發效率,增強并行協同設計制造能力,保證艦船設計的總體最優,進而提高整個造船工業的設計制造水平。
知識庫[5]是知識工程中結構化,易操作,易利用,全面有組織的知識集群,是合理組織的關于某一特定領域的陳述性知識和過程性知識的集合,采用某種知識表示方式進行存儲、組織、管理和使用,知識庫中通常蘊含著客觀規律、理論知識、事實數據之類的底層信息,或是由專家經驗得到的啟發式信息,通過簡單的查詢和搜索不能獲取這些信息,需要在海量數據的基礎上,經過分析推理等方法提煉出來。
隨著信息化技術的不斷發展,艦船設計廣泛采用數字化工具建模,所存儲和處理的數據與日俱增,當這些數據累計到一定程度時,就會產生一些規律性的結論。通過知識工程的方法積累和重用現有艦船設計的數據,進行研發創新,以更低的成本、更少的時間設計出更加優異的船舶產品,對于企業保持快速研發反應能力和競爭優勢至關重要。
知識庫來源于數據庫,但不僅僅是數據庫,它不僅使用數據庫中的事實數據來表達知識,而且使用數據庫的邏輯蘊含來反映知識規則的因果關系,以實現知識庫的推理功能[6]。基于艦船設計的知識庫結構均為確定性的知識,將知識庫中的產生式規則表達引入數據庫,并根據數據庫的特點,對產生式進行特定的表達。
本文采用實體—屬性—聯系模型,其數據模型表示為:實體<Entity>,屬性<Attribute>,聯系<Relationship>,通常規則采用多元組的形式表示,即 E(A,R),其中,E表示實體,A表示實體 E的屬性,R表示與實體E相關的聯系,通常一個實體包含多個屬性與多個聯系,屬性和聯系分別可以表示為 A{A1,A2,…,Am},R{R1,R2,…,Rn}。
以艦船設計中某一專業范疇的設計參數為屬性,相關參數之間關聯所具有的制約和依存規則為聯系,例如某管路設計,其屬性包括長度、直徑、材料等,其聯系包括附加閥門、傳輸燃油等信息,則可表示為:
管路({長度,直徑,材料…},{附加閥門,傳輸燃油…})
通過數學建模,將多專業多學科數據聯系起來,形成多維的艦船設計集成與優化知識庫,其結構如圖1所示。

圖1 艦船設計集成與優化知識庫結構
該知識庫最底層為艦船設計各專業與學科基礎數據,中間層是經過分類與組合后的模型庫,最高層是將設計與仿真分析相關數據集成優化后的知識庫。以中間層模型庫為控制對象,因此知識庫的基本結構是層次結構,是由其知識本身的特性所確定的[7]。在知識庫中,數據層之間通常都存在相互依賴的關系,設計模型庫(DMB)和仿真試驗模型庫(EMB)是集成與優化知識庫(KBOI)的基礎核心內容,包括各專業模型庫數據,兩者建立統一的索引及通用接口,可以對集成與優化知識庫進行訪問與操作,索引以關系方式進行組織,通過關鍵字或模型字典表達各個基本模型元數據之間的關系。
為了能夠有效管理知識庫中的海量數據,并快速分析出其中有用的信息,需要對多維的數據模型進行關聯與分類,如為了實現節能減排,設計時需要考慮結構、管路、電力、動力等多個方面的優化措施。這是一個在數據中進行推理匹配的過程,挖掘關聯規則首先是挖掘出頻繁項目集,其次是生成關聯規則,然后去除冗余規則,這一過程隨著數據類型的多樣化,計算復雜度較高。根據艦船設計知識庫多專業的特點,本文根據Apriori算法[8-10]提出根據問題支持度生成決策集,從而確定數值型與類別型屬性概念層次的方法,提高了算法的計算效率以及可擴展性。
設屬性集為 A= {A1,A2,…,Am},關系集為R= {R1,R2,…,Rn},Z 為事務數據庫,也即是設計過程中,對每一個邏輯單元執行的一系列操作,X,Y?A×R是由屬性及關系構成的項目集合,稱為項目集,也即是多維數據集。
如果項目集X中包含k個事務,則稱其為k-項目集。項目集X有兩個重要性質:若X為頻繁項目集,則X的所有子集都是頻繁項目集;若X為非頻繁項目集,則X的所有超集均為非頻繁項目集。
設X∩Y=φ,多維多層模式X∪Y為關聯規則,記做X→Y。
如果事務數據庫Z中有s%的事務包含X,則稱項目集X的支持度為s%,記為s%=support(X,R)。則可以定義,如果對X∪Y的支持度大于用戶給定的最小支持度閾值,就稱該項目集是頻繁項目集,記為minsupp≤support(X∪Y,R),事務數據庫Z中支持X∪Y的事務數與支持X事務數的比值稱為該關聯規則的支持度閾值,記為minsupp≤support(X∪Y,R)/support(X,R)。
多維數據關聯與分類過程如下:
1)首先掃描事務數據庫Z,根據實際應用地意義對概念層次結構進行重組,分割屬性類型集和取值區間,計算出所有1-項目集的支持度,從而得到滿足minsupp的頻繁項目集X1;
2)通過k-1頻繁項目集Xk-1與X1的相互組合,擴充到后選k-頻繁項目集Xk,當后選k-項目集的某個k-1的子集不屬于Xk-1時,則該子集對于頻繁項目集Xk而言是冗余規則,可以去除;
3)計算Xk中各個項目集的支持度s%,刪除不滿足支持最小支持度s%的項目集,形成簡約完整的頻繁項目集。循環迭代后,找出所有的頻繁項目集,可計算出關聯規則的支持度minconf;
4)支持度minconf也即是該優化方案的可執行度,設計時,根據支持度選擇相應最優化的參數。
在實際艦船設計知識庫的應用中,不同專業項目關聯支持的概率差異非常大,如果采用較大的單一支持度,很多相關的有價值信息將丟失,如果采用較小的單一支持度則會產生很多冗余規則。所以,為不同專業設置合理的支持度閾值非常重要。如在船體型線設計中,中橫剖面系數Cm為中橫剖面在設計水線下的型面積Am與其相對應設計水線寬B和設計吃水T的乘積,可以表示為:

內河船和大型運輸船的中橫剖面系數較大,中橫剖面較豐滿;快速船和中小型船的中橫剖面系數則較小,因此,在實際應用中,可以針對所設計船的種類,設定中橫剖面系數Cm的支持度閾值,得到最為相關的取值,則可以方便計算出Am=Cm×B×T,并可挖掘與之相關的信息,如總長、垂線間長、型深等參數,計算船體重心浮心,提高設計精度和準度。
知識庫系統具有完整的數據管理功能,能夠提供原始數據,又能動態組合復合數據,提高了設計的靈活性和擴展性,降低了設計難度,不僅側重于數學模型的分析,對于評價、規劃和預測類的分析也提出了更高的要求。數據倉庫、聯機分析技術的發展為數據分析提供了更加有效的支持。以多維數據模型為核心的數據倉庫和聯機分析技術相結合,能夠從不同的角度分析數據,不僅提高了總體性能分析的決策能力,有利于數據分析的多目標性,也為數據分析的有效性提供了有力支持。
在艦船綜合性能分析系統結構框架中,將定性分析與定量分析相結合,基于集成模型的方法實現知識的自動獲取,以多知識庫集成模型數據分析為主體,構建一個綜合性能分析系統架構模式如圖2所示。

艦船設計綜合性能分析系統以集成模型庫和知識庫為核心,將多維數據挖掘與分類、知識推理、數據倉庫以及聯機分析技術的有機結合,將以模型驅動為基礎的分析模式提升為數據驅動的分析模式,從大量的數據中發現知識并驗證知識,并將知識輔助和用于設計分析,實現了綜合的決策融合,大大增強了數據分析基礎,具有更好的智能決策支持能力。
其中,海量數據倉庫用于存儲和組織歷史設計數據,包括船體、動力、電力、結構、管路等多學科多專業的設計資料和文檔資料,通過對底層數據庫中的數據進行集成、轉換和歸類,重新組織成面向全局的多維數據試圖,為模型集成、聯機數據分析提供數據支持。
聯機數據分析處理從海量數據倉庫中構建面向分析的多維數據模型,再通過多維分析方法從不同的視角對多維數據進行分析、比較和解釋,行成可讀信息。
數據挖掘以海量數據倉庫中的大量數據為基礎,自動發現數據中潛在模式,為各個環節提供知識支持并以這些模式為基礎實現決策支持。主要包括兩個方面:一是從大量歷史數據中發現設計優化特性、性能優化特性等相關知識,支持艦船設計制造過程中各個環節的進行;另一方面發現設計優化的典型模式和潛在規律,建立艦船綜合性能分析模型,提升設計質量。
知識庫及知識推理用于存放和管理由數據分析得到的各種知識,為集成與決策建立了基礎,在決策過程中為模型的順利運行提供知識推理和規則調用,并可根據模型運行情況來改進集成模型庫中的模型,從而提高模型庫的智能性。
集成模型庫用于通過知識經驗規則協助用戶建立、存儲和管理多種綜合應用模型,實現多知識庫模型集成決策融合。
信息融合有兩個外部交互接口,一個是與知識庫通信的接口,通過專家經驗知識或從數據庫中進行數據挖掘等渠道來建立知識庫;另一個是用戶接口,與用戶進行中間交互,返回分析運行結果等。
在具體艦船設計的應用中,首先對決策問題進行數學建模描述,然后系統對問題進行分析推理,通過模型集成庫的智能性判斷及模型選擇優化,實施模型的優化運行、評價、模型的求解和結果顯示輸出。根據艦船設計多年的歷史數據積累,進行仿真測試與應用開發,提高設計質量和設計效率。
耐波性是艦船設計中一個非常重要的數據,涉及到船在波浪上各種運動及其后果的復雜現象。與耐波性相關的參數有很多,以某排水量2 580 t船的設計數據集為基礎,對其中的某些參數進行數據挖掘測試,該船所處海域為我國南方海域,涌長約為60m,波浪周期為6 s,該船總長度為 108m,最大船寬 14m,設計吃水 3.8m,其主要船型系數中,方形系數Cb=0.489,水線面系數Cwp=0.744,多維數據關聯規則的目標是發現對耐波性影響較大的屬性,表1為數據挖掘后的結果,可以分析出相關屬性個數、挖掘時間、支持度與頻繁項目集之間的關系。

表1 耐波性參數挖掘
由表1可以看出,對于同一個參數,關聯屬性數量不同,挖掘時間也不同,對耐波性影響最大的幾個參數分別是船長、水線面系數、涌長與船寬。事實上,艦船設計過程中,一個參數的改變將引起其他參數做出相應的變化,因此對耐波性的影響應該做出綜合考慮,隨著數據規模的增加,算法的復雜度大大增加,為了挖掘更大規模的數據集,可以采用分塊的思想對大規模數據集進行多維關聯規則挖掘,以期得到更好的設計參數。
將設計模型庫和仿真分析模型庫進行有效的集成優化,形成多維設計信息知識庫,在其基礎上結合數據挖掘和聯機分析,可以解決目前艦船設計中模擬預測分析等關鍵性的核心問題,充分高效地利用已有的知識和模型進行研發設計。
通過建立基于知識庫的艦船智能化設計系統,將艦船設計研發相關的技術、流程、經驗和數據等資源進行有效管理,采用知識工程手段將零散的資源整合,提取出潛在有用的信息,隨著工作的持續進行,一方面提高了企業的研發水平,另一方面也為企業積累了異常珍貴的智力資產。圍繞船舶工業的發展目標,大力發展艦船數字化設計技術、整合優勢資源、推廣現代造船模式,對于提升我國船舶行業數字化造船水平,增強國際市場競爭能力具有重要意義。
[1]曹玉姣.我國數字化造船發展現狀[J].船舶工程,2008,30(3):6-9.
[2]黃迪.數字化造船:中國造船工業的必然選擇[J].中國水運,2008(10):44-45.
[3]喬珊,應文燁,何剛.艦船數字化設計應用研究[J].中國艦船研究,2007,2(4):20-25.
[4]吳廣明.CAE在船舶結構設計中的應用及展望[J].中國艦船研究,2007,2(6):30-34.
[5]王忠祥,郭寶恩.基于數據庫的知識表達與推理研究[J].機械設計與制造,2005(9):152-154.
[6]徐循.數據挖掘算法與應用[M].北京:北京大學出版社,2007.
[7]LEE K H,KIM K S,et al.Development of enhanced data mining system to approximate empirical formula for Ship design[J].Lecture Notes in Computer Science,2007(11):425-436.
[8]AUBRT D,NOVELLI N,MELANCON G.Visually mining the datacube using a pixel-oriented technique[C]//11th International Conference on Information Visualization,Zurich,2007.
[9]SHAHRABI J,NEYESTANI R.Discovering iranians’ shopping culture by considering virtual items using data mining techniques [J].Journal of Applied Sciences,2009 (13):2351-2361.
[10]CHEN M.Raning discovered rules from data mining with multiple criteria by data envelopment analysis [J].Expert Systems with Applications,2007(33):1110-1116.