林名馳,王成宇*,2,唐政
1 海軍工程大學 管理工程與裝備經濟系, 湖北 武漢 430033
2 中國人民解放軍92690部隊, 海南 三亞 572000
維修費用是艦船全壽命周期費用的重要組成部分[1-2],隨著科技發展與艦船復雜程度的不斷提高,其在全壽命周期費用中的占比也隨之增加。在艦船維修費用中,計劃維修費用的占比最高。在全面建設世界一流海軍的背景下,艦船的用、修矛盾不斷凸顯,維修制度改革刻不容緩,隨之而來的艦船維修費用計劃制定與撥付原則調整也逐漸提上日程,因此,精準預測艦船的計劃維修費用具有重要的意義。
艦船計劃維修費用的預測方法很多,例如工程法[3]、專家估算法[4]等傳統方法,其中工程法需要大量的維修費用數據積累,實施難度較高;專家估算法即基于專家意見進行維修費用估算,其主觀性較強的特點限制了應用效果。目前,神經網絡[5]、灰色預測[6]和支持向量機[7]等新型的費用預測方法逐漸在該領域得以應用,此類方法在預測精度方面具有較大的優勢,但模型構建過程卻較為繁瑣,且神經網絡方法易陷入局部最優解的困境,而支持向量機方法則易出現過擬合的問題,最終將導致模型的預測效果不穩定。
案例推理(case-based reasoning,CBR)作為人工智能領域的一種新興理論[8],可以通過判定目標案例與已有源案例的相似程度進行檢索,并基于一定原則對檢索案例進行修正與調整,最終得到目標案例的預測值。CBR的推理過程不需要大量的維修費用數據支持,所有計算均基于艦船特征屬性值,可以保證推理過程的客觀性;同時,不需要構建復雜的模型,從而避免了模型適應性的問題。
因此,本文擬提出基于CBR的艦船計劃維修費用預測方法,首先采用特征向量對案例進行表示,然后采用基于加權歐氏距離的K 近鄰(Knearest neighbor,KNN)算法進行案例檢索,同時結合粗糙集理論確定特征屬性的權重分配,最后將結合各目標案例與相似案例的相似度對預測值進行修正,并基于整體相似度來判定是否將新案例加入已有案例庫中,從而提高艦船計劃維修費用的預測精度。
CBR是基于類比的推理,即通過目標案例與源案例的相似性匹配進行問題求解,其分析過程由4個階段組成:案例表示、案例檢索、案例重用和案例更新。當遇到一個新問題時,可以在存儲歷史問題解決經驗的案例庫中查找與新問題相似的案例,并將相似案例的解決方法進行一定的調整,從而作為新問題的解決方案;同時,該新問題也將隨后納入案例庫中[9]。
案例表示即對案例庫中源案例主要特征的描述,其目的是對不同案例進行區分,以便后續案例的檢索操作。常見的案例表示方法包括特征向量表示法、類別?案例表示法和動態存儲表示法等,由于計劃維修費用與艦船特征參數之間具有較強的相關性,且各特征參數相對獨立,符合特征向量表示法的應用特點,故本文將采用艦船的主要特征參數作為特征屬性,并由多個特征屬性組成的特征向量及其對應的維修費用來表示案例。首先,設定艦船的計劃維修費用案例i,其特征向量Ai為艦船的主要特征參數,例如建造經費、空載排水量、艦長、最大航速、主機數量、人員編制等參數,該類參數在不同艦船之間的區分效果較好,宜作為特征屬性;然后,設定解向量Bi作為艦船計劃維修費用值,其中

式中:ai1,ai2,···,ai6為 特征向量Ai的特征參數,其中i為案例編號;bi為 解向量Bi對應的維修費用值。由此,采用<Ai,Bi>即可對某一特定案例進行表示。
案例檢索是CBR的重要環節,即通過特定的檢索方法在案例庫中搜索與目標案例相似度較高的源案例。目前,常用的檢索方法包括KNN算法、歸納索引法等,其中KNN算法可以與領域知識有效融合,其操作較為簡便且應用效果較好[10],因此,本文擬采用KNN算法進行相似案例檢索。
KNN算法通過計算目標案例與案例庫中各源案例特征屬性的相似度來進行案例檢索,常用的相似度度量方法包括歐氏距離、皮爾遜相關系數、余弦相似度等。鑒于艦船各特征屬性對計劃維修費用的影響程度不同,所以本文將采用加權歐氏距離進行相似度度量,并引入權重系數來表征各特征屬性的重要程度。目標案例與源案例的相似度S(Ai,A0)為

其中,歐氏距離D(aij,a0j)的計算公式為
式中:Ai為源案例,其中i為案例庫中各源案例的編號;A0為目標案例;ωi為權重系數,用于表征各特征屬性對艦船計劃維修費用的影響程度;aij為第i個源案例的第j個特征屬性值,其中j為特征屬性編號;a0j為目標案例的第j個特征屬性值;maxj和minj分別為第j個特征屬性的最大值和最小值。
采用式(4)計算歐氏距離時,需對特征屬性的差值進行歸一化處理以符合相似度計算原則。在計算得到相似度之后,即可根據相似度從高到低對源案例進行排序,并設置案例的檢索個數k值,從而得到與目標案例最為相似的k個源案例,即相似案例。
為了得到科學合理的權重分配,本文擬將粗糙集理論中屬性重要度的概念引入權重系數ωi的計算中。對于一個決策系統,不同的條件屬性對決策屬性的支持程度(即條件屬性的重要度[11])也有所不同。表征屬性重要度的啟發式信息很多,例如支持度、依賴度、互信息等,各種形式的屬性重要度本質差別較小,本文將選取支持度來計算屬性重要度。
根據粗糙集理論,將案例庫中的各特征屬性視為條件屬性集C,將艦船計劃維修費用視為決策屬性集D,條件屬性集C對決策屬性集D的支持度γC(D) 為[12]

式中:POSC(D)為條件屬性與決策屬性的正區域;U為論域,其表示條件屬性對決策屬性的支持程度或分類能力。
所謂單個條件屬性對決策屬性的支持度,即去掉該屬性之后條件屬性對決策屬性支持程度或分類能力的變化,其計算公式為

式中:sig(a,C;D)為條件屬性a的屬性重要度;γC?a(D)為決策屬性D對條件屬性集C–a的依賴度。sig(a,C;D)越大,則說明在條件屬性集C中,單個條件屬性a對決策屬性的影響越大,a越重要;反之,a越不重要。
粗糙集理論的最顯著特點是整個計算過程均由數據驅動,可以保持權重系數的客觀性和合理性,且該理論易于理解,操作簡單。
由于相似案例與目標案例通常存在差異性,所以不能直接采用相似案例的維修費用作為目標案例的預測值,而是需對相似案例進行調整與修正,即案例重用。由上文可知,目標案例與相似案例之間的相似度表征了二者主要特征屬性之間的相似程度,而案例中艦船的主要特征屬性與計劃維修費用之間具有較強的相關性,故本文考慮將該相似度用于相似案例的維修費用預測。根據k個相似案例的維修費用來計算目標案例維修費用的過程,實際上可以視為多組預測結果的組合,為此,本文將引入組合預測的思想,其中等權組合的預測效果相對較好[13]。首先,對各相似案例調整后的維修費用進行求和,然后等權平均,即可得到目標案例修正之后的維修費用預測值計算公式如下:

式中:S(Al,A0)為 目標案例A0與 相似案例Al之間的相似度,其中相似案例編號l=1,2,···,k(k為相似案例的最大編號);bl為相似案例的費用值。
得到目標案例的預測值之后,目標案例的特征屬性向量與其維修費用將共同組成一組新的向量序偶。通過將新案例更新至案例庫中進行擴充,將有利于后續推理工作的長期開展。然而,案例庫的更新應符合一定規則,若新案例與案例庫中已有案例的相似度很高,則該案例對提高檢索效率的意義較小,甚至可能導致庫中相似案例過多而降低檢索效率,故在本階段需開展相似度判定。
將目標案例的維修費用加入特征向量中,即可與各特征屬性共同組成新的特征向量Cm:

式中:am1,am2,…,am6為 特征向量Cm的特征參數;bm1為 修正之后的維修費用值,m為經過更新之后的案例編號。
基于新的特征向量并結合式(3)和式(4),即可計算新案例與各相似案例的整體相似度。整體相似度將維修費用納入了計算范圍,可以更全面地反映新案例與已有案例的相似程度。由于已檢索到的k個相似案例在案例庫中與目標案例的相似度最高,所以僅需對目標案例和這k個相似案例進行判定即可:若整體相似度的均值高于原相似度,則不對案例庫進行更新;反之,則將新案例增加至案例庫。
本文擬采用美軍艦船計劃維修費用數據[14]對所提方法進行驗證,其構建的案例庫包含180組案例(費用均已折算到同一年),從中隨機選取6組作為測試案例,如表1所示。
首先,根據粗糙集理論計算各特征向量的權重系數;然后,將表1中的6組測試案例分別作為目標案例,根據式(3)和式(4)分別計算其與案例庫中源案例的相似度并進行檢索;最后,設置k=3,根據式(7)計算各目標案例的預測值。同時,利用SPSS軟件中的工具包,將特征屬性設為自變量,維修費用設為因變量,分別采用線性回歸預測法和徑向基函數(radial basis function,RBF)神經網絡法對6組測試案例的維修費用進行預測,這2種方法和本文方法的預測結果與實船維修費用的相對誤差如表2所示。

表1 測試案例特征屬性及維修費用Table1 Test case feature attributes and maintenance cost

表2 預測結果對比Table2 Comparison of prediction results
由表2可以看出,針對6組測試案例,本文方法所得預測結果與實船費用值的平均相對誤差為8.7%,而線性回歸預測法和RBF神經網絡法的平均相對誤差分別為10.4%和10.2%,由此可見,本文所提方法的預測精度更高。
在艦船維修制度改革的趨勢下,針對維修費用計劃制定與撥付原則提出的新要求,同時結合已有維修費用預測方法的不足,本文提出了一種基于CBR的艦船計劃維修費用預測方法。該方法不需要建立復雜的數學模型和大量的維修費用數據采集,主要基于已有案例進行預測,具有較高的適用性和準確性。然而,CBR方法的準確性取決于案例庫的數據量,豐富、典型的案例庫可以為處理復雜的艦船計劃維修費用預測問題提供有力的數據支撐,所以典型案例的甄別與積累尤為重要。同時,對于某些重要的艦船特征屬性的定量表示問題、檢索過程的優化問題等,還需在后續工作中開展進一步研究。