劉偉杰 ,徐 杰,2,吉衛喜,2,王玉源
LIU Wei-jie1 ,XU Jie1,2 ,JI Wei-xi1,2,WANG Yu-yuan1
(1.江南大學 機械工程學院,無錫 214122;2.江蘇省食品先進制造裝備技術重點實驗室,無錫 214122)
隨著互聯網與工業融合的創新與發展,企業信息系統、裝備物聯網和企業外部互聯網已經成為工業大數據的三大主要來源,工業大數據及應用技術將成為企業未來提升制造業生產力、競爭力、創新能力的關鍵要素[1,2]。隨著數據收集、存儲處理的技術日趨成熟,在復雜數據背景下,對蘊含在工業大數據中高價值的知識的自動挖掘和獲取提出了更進一步的要求:更高水平的大數據知識工程、更好的知識過濾機制、更合理的知識評價體系[3]。
知識工程概念首先在1977年第五屆國際人工智能會議上由斯坦福大學費根堡姆提出,知識自動化的提出豐富了知識工程的內涵,是人的智能型工作向控制系統的自動化延伸,是工業生產中采用機器實現基于知識自動處理的建模、控制、優化及調度決策的自動化系統理論、方法和技術[4]。如今在大數據這一背景下,越來越多的研究立足于如何從海量的數據中自動提取和分析出高價值的知識,進而實現高水平的大數據知識工程。其中知識獲取是整個知識工程的核心,現如今主流的研究有關聯規則挖掘、人工神經網絡、決策樹、聚類分析、基于事例的推理方法等[5~9]。在知識建模應用方面,吳信東等人提出一種基于三層次知識建模的BigKE模型,解決了碎片化知識建模與多數據源的在線學習、碎片知識非線性融合等問題,實現了個性化的知識導航服務[10];劉海濤等人運用Markov模型和序列模式算法挖掘面向主題的知識學習模式,提出了一種基于知識模式挖掘的流程知識推薦系統[11];李傳坤等人從知識獲取與融合、故障感知與識別、故障診斷與決策三個層次對化工過程故障進行監測診斷,并以專家知識庫為載體進行經驗的傳承[12]。
如上所述,當前知識工程的相關研究多立足于理論算法與模型研究,注重解決知識工程某一“點”的探索。然而離散制造過程工業大數據的采集處理、信息關聯集成、知識獲取應該是一個整體過程,單方面的知識獲取研究容易使工業過程分析的全面性不足。本研究以某電梯零部件數控制造車間為對象,首先結合其制造過程的離散特性,基于傳統生產管理方法實現車間業務流程優化重構;然后針對數控設備、制造資源生產狀態,計劃執行、質量檢測等關鍵制造過程數據實時采集處理,建立面向多層次制造、多目標評價的工序制造過程案例模型;最后采用基于模糊c-means聚類(FCM)、互信息的改進的案例知識獲取方法,實現車間工序制造過程知識庫的自生長、自優化,為車間智能運作維護奠定基礎。
離散制造數控車間業務流程設計如圖1所示,將車間業務流程細分為車間計劃、制造資源、生產計劃與制造信息四個主要業務流程。車間計劃主要包括車間整體生產任務的安排,依據車間生產知識模型結合車間實時生產狀態,優化安排生產維護作業;生產計劃包括依據車間計劃安排生產任務、工序派工、制造技術資料匹配等;制造資源計劃車間生產計劃基于機床、物料、工裝夾具等制造資源正常施行的保障;離散車間制造信息系統是一個跨時域、地域的復雜系統,主要包含在制品工藝設計、生產流轉、生產過程進度與質量、制造資源生產狀態、操作人員行為與用戶反饋等信息。如何實現上述業務流程信息的可靠采集處理分析與動態關聯并實現相關知識的主動發現為車間運維計劃提供依據是解決離散制造智能化運作維護的關鍵所在。
如圖1中車間數據集成模塊所示,數控設備作為制造資源流的終點,智能終端作為制造信息流的終點,兩者依據零件制造計劃實現數據動態匹配關聯。依據企業未來發展目標,車間數據采集存儲系統需要實現對設備運行狀態,在制品加工、檢測等信息實時采集,并通過合理的存儲方法實現底層數據與知識應用層軟件信息共享。現將需求歸納為以下幾點:
1)車間設備聯網。實現智能終端與不同類型機床之間可靠通信,智能終端集群與車間主節點服務器通過局域網統一組網、數據可靠傳輸共享。
2)設備運行狀態實時采集。實現對機床實時切削參數、切削NC代碼版本、刀具切削時間、設備維護事件記錄、設備耗能水平等信息采集,并提供車間生產狀態實時監控與可視化。
3)在制品生產狀態信息實時采集。實現對在制品物料信息、生產技術資料信息、加工進度信息、質量水平信息的實時關聯采集,實時定位物料流轉,動態報檢與入半成品庫。
2.2.1 系統硬件設計
該企業金加工離散制造車間共有30臺數控加工裝備,設備主要類型為FANUC系列與Brother系列數控加工中心,設備普遍開放RS232接口,部分FANUC系列開放以太網接口。系統硬件與組網方案設計如圖2所示。

圖1 離散制造數控車間業務流程框架

圖2 車間硬件組網方案設計
圖2中硬件網絡框架共分為制造資源、數據服務、知識表達三層。制造資源層基于智能終端實現與數控機床通信實現機床狀態采集,智能傳感設備通過采集機床消耗、振動等狀態信息實時進行特征提取并與終端通信。基于標簽識別器與智能終端的通信實現車間計劃執行過程監測。針對設備運行狀態信息采集可基于數控宏指令與FOCAS庫函數的方法通過系統地址變量讀取對應機床信息實現設備數據采集,其中關鍵地址信息與宏命令程序對應如表1所示。

表1 宏命令與操作系統地址變量對應表
2.2.2 系統軟件流程設計
在制品制造過程信息采集流程如圖3所示,基于信息采集流程開發如圖4所示采集系統。工人登錄到車間生產管理系統,當系統檢測到物料到位后顯示工人待加工工序任務,工人選定生產任務后方可查詢相關圖紙、工藝信息,以及啟動機床通信。如圖4(a)所示,通過與機床建立通信后,可在獲取NC文檔后啟用編輯自動鑲嵌宏命令傳輸到數控機床,零件加工開始后可實時獲取設備切削參數、零件加工時間、零件加工數量、設備消耗與運行狀態、刀具使用壽命等實時信息;終端可記錄設備歷史維護數據,工裝維護數據以用于制造資源可靠性評估。每當一個零件加工完成,智能終端即對其加工過程數據進行預處理;圖4(b)為零件電子流轉卡,二維碼用于掃描報工,工人完成工序所有加工任務后終端進行數據關聯與集成,傳輸到數據服務層,觸發工序制造過程案例知識自動獲取;同時零件入半成品庫,啟發生產計劃軟件進行生產任務派工,等待物料轉移到下一工序。

圖3 軟件系統執行流程設計


圖4 采集系統
工序完工后其制造過程數據經智能終端標識、量化、描述為一條工序制造案例,其中包含設備運行信息、工裝夾具信息、零件設計制造特征信息、制造過程評價信息等。當數據庫內的源案例增長了一定數量時,系統基于閾值觸發機制,實現案例知識自動獲取[13]。知識獲取流程如圖5所示,通過模糊c-means聚類方法實現案例知識聚類劃分;通過有效性評估衡量FCM水平;通過計算制造過程屬性與工序評價屬性之間的相互信息,實現屬性權重估計與案例約簡;通過K-最近鄰(KNN)評價目標案例與案例代表相似性檢索以及案例保留與維護。

圖5 車間制造工序案例知識獲取流程
案例表示的目的是提取有用信息,便于計算機快速理解識別。為便于實現對工序工況的預測與及時反應,設計工序案例內容由兩部分組成:工序制造屬性與工序評價屬性,其一般結構可表示為:

其中M與E分別代表制造與評價屬性,n表示屬性數量。本文中M屬性有數值與類別標識兩種類型,E屬性只有數值類型,而M類別標識屬性只用于案例初始分類器,因此每個案例可以等價于n維空間中的一點,且案例之間的相似性可以轉換為點之間的加權歐幾里德距離。權重分配方法在3.2節中介紹。
3.2.1 模糊c-means聚類
FCM是一種用隸屬度確定每個數據點屬于某個聚類的程度的一種聚類算法。X為歐幾里德空間內的k維數據集,X={x1,x2,…,xn}∈Rk,FCM目標函數定義如下:

其中U=(uij)c×n是模糊劃分矩陣,且隸屬度uij滿足0<uij<1,m為識別聚類結果模糊程度的模糊因子;dij=||ci-xj||為第i個聚類中心與第j個數據點間的歐幾里德距離。式(2)約束條件為:

基于以上約束可得到類中心與隸屬度迭代公式:

3.2.2 聚類有效性評估
本研究采用模糊聚類的有效性指標分離系數來衡量聚類水平。根據上文聚類給定的簇數與模糊劃分矩陣,數據集X的分離系數PC(+)定義為:

其中PC(+)中只包含隸屬度信息,當1<c<n時,PC(+的取值范圍為[1/c,1],指標隨聚類數的變化呈現單調變化趨勢,且值越大分類效果越好。設Ωc是一組有限的“最優”分類矩陣,若存在(Ua;ca)滿足:稱(Ua;ca)為最優聚類結果,ca為最佳簇數。
3.2.3 K-最近鄰
通過FCM劃分案例后,簇中心即為每個簇的可用標記案例,本研究通過該標記運用K-最近鄰檢索與目標案例最高相似性的標記案例實現案例匹配,在最終匹配后,將源案例頻數+1。
有xi=[xi1,xi2,…,xij,…,xik,o1,o2,…,on]∈X,其中k為條件屬性的數量;xij,oin代表第i個案例中M屬性值以及該案例所對應第n個E屬性。給定目標案例xx與標記案例xi,可根據式(7)計算兩者之間的局部相似度:

由式(7),案例全局相似度可表示為:

xxj代表目標案例的M屬性值,因為不同M屬性對E屬性的影響是不同的,這里引入權重系數wj,表征M屬性對E屬性的影響程度。當案例全局相似度sim值越接近1時,說明兩案例之間相似度越高。在相似性判斷中重要性越高,本文采用互信息的方法實現對權重的估值。
3.2.4 互信息
互信息也稱作轉移信息,是衡量兩個隨機變量之間的依賴性量度。互信息的定義如下:

其中熵H(X)、H(Y)表示X,Y的不確定性。H(X,Y)表示X與Y的共熵;p(x,y)為隨機變量(X,Y)的聯合概率分布函數;p(x),p(y)為X,Y的邊緣概率分布函數。
本研究計算制造屬性與單一評價屬性之間的相互信息并通過式(10)估計單一E屬性權重,多E屬性綜合權重由式(11)給出,w'k為第k個E屬性權重,因此在評估案例相似性時可根據檢索需求依據式(11)調整各個E屬性權重提高檢索可靠性與準確性。


3.2.5 案例知識庫維護
隨著制造過程的案例積累,案例數量會持續增加,而盲目擴大案例庫容量必然會導致案例匹配的效率降低。因此本研究提出如圖5所示解決方案,新案例在與標記案例匹配經最近鄰算法搜索到最大相似性案例后,若兩案例相似度高于閥值則不入案例庫,只將源案例出現頻數+1;若相似度在可接受范圍內,將該案例劃入標記案例所在類庫;若分類器無法實現分類或案例相似性匹配不理想,則將新案例保留,同時標記為特殊案例與標記案例,特例存儲器數量+1,待計數器到達閥值,則啟發案例庫重新優化分類器與建立聚類劃分模型。
本研究基于某電梯零部件企業數控加工車間工序制造過程數據進行系統搭建與數據實驗。基于java開發工具,數據庫選用Microsoft SQL Server 2008,操作系統windows 7,由于該車間設備普遍開放串口通信,為便于車間應用維護本研究基于串口RS232與數控宏指令鑲嵌來實現設備狀態獲取與NC文件的上傳下載。終端數據采集系統實時運行如圖6所示。該企業制造車間30臺數控設備平均每天可完成工序案例數為15條,每年可產生超過4500條工序案例。選擇其中4000條源案例構建知識庫模型,選其中400條案例用于測試。

圖6 車間系統實際應用效果圖
在案例知識獲取時,首先經初始分類器依據表2中相關制造類別屬性將初始案例分為18個特征類;選其中案例x1所在A1類作為聚類劃分實驗對象,該類內含392條案例,然后關聯計算每條案例的E屬性值,基于實際生產維護需求,E屬性選擇成本、質量、效率三種屬性。其中效率評價屬性計算方法如下:


表2 工序制造類別屬性信息部分內容

表3 A1類特征類內案例M屬性部分內容
考慮影響E屬性的主要影響因素,從案例數據篩選工裝可靠性x1、設備可靠性x2、上道工序質量x3、制造過程切削率x4、工人技術水平x5,共5個M屬性作為特征類內部聚類劃分的依據,部分數據內容如表3所示。試驗基于python工具實現案例特征類內部聚類劃分與分離系數計算,發現當簇數c小于5時,隨著c的增加,分離系數PC(+)減小,聚類性能變差。但是如果c過小,在案例檢索匹配過程中運算復雜度會增加。綜合考慮算法效率,取式(6)內參數值m=2,簇數c=3,聚類效果如圖7所示,解得此時分離系數PC(+)=0.650,認為聚類效果符合需求。經劃分后的聚類中心作為標記案例如表4所示,其中c1,c2,c3分別對應圖7中類號0,1,2。

圖7 FCM聚類劃分效果圖

表4 標記案例M屬性數值信息表
為評估案例全局相似性以及約簡相似案例,選取源案例依據式(9)、式(10)依次計算制造屬性與單一評價屬性的互信息,計算過程中,采用直方圖法評估無偏估計中的概率密度,計算結果如表5所示。

表5 E屬性與M屬性相互信息與權重值
以現有目標案例x=[79.6,87.5,92.2,86.5,92]為例,要求E效率:E質量:E成本=2:1:1,結合表5與式(11)求得對應wj=[0.2874,0.2247,0.2013,0.1502,0.1364],依據式(7)、式(8)計算目標案例與標記案例相似度,依次解得sim=[0.9331,0.9708,0.9460],可知目標案例與標記案例c2相似。將該目標案例到標記案例對應類庫進一步檢索,求其最終sim,若sim>0.995則將該案例舍棄,將匹配到的案例頻數項+1;若sim<0.85則標記為該特征類下的標記案例,同時存入特殊案例庫;若0.995>sim>0.85將該目標案例直接存入該類庫。所有測試案例檢索完成,并按照圖5流程完成案例知識庫維護后,400條車間工序案例經知識獲取更新到18個特征類下的共46小類,該數控車間主要加工軸套、盤蓋類電梯零部件,因此上表2中的特征類代表中A1、C1類知識含量明顯上升,其他特征類知識含量均有小幅度上升,說明本研究提出的工序制造過程案例知識自動獲取方法是有效的,且可以實現案例知識庫的自動生長與優化。
隨著工業化與信息化的不斷發展與融合,基于車間制造過程知識是實現車間智能運維的必經之路。本研究從車間制造業務流程優化出發,實現了基于智能終端的車間實時制造過程數據的多層次采集;通過聚類劃分與互信息的方法,基于制造過程采集數據實現了工序制造案例知識庫的自動生長與優化,并通過實際應用證明了方法的有效性。為實現基于案例的車間智能維護奠定了基礎。